
SPSS操作:多個相關(guān)樣本的非參數(shù)檢驗(Cochran's Q檢驗)
一、問題與數(shù)據(jù)
某康復(fù)科醫(yī)生擬評價康復(fù)訓(xùn)練對卒中后患者體能恢復(fù)的效果?;颊叻謩e在開始康復(fù)、康復(fù)3個月和康復(fù)6個月時進行體能測試。為了保證一致性,三次體能測試內(nèi)容是一樣的,體能測試的結(jié)果為“通過”和“不通過”。該醫(yī)生想知道卒中后患者體能測試的結(jié)果為“通過”的比例是否一直上升。
該研究隨機選取了63例進行康復(fù)訓(xùn)練的卒中后患者,并收集了所有研究對象的開始康復(fù)時的體能測試結(jié)果 (initial_fitness_test),康復(fù)3個月時的體能測試結(jié)果 (month3_fitness_test)和康復(fù)6個月時的體能測試結(jié)果 (final_fitness_test)。結(jié)果均為“通過(Passed)”和“不通過(Failed)”的形式(分別賦值為1和2)。部分數(shù)據(jù)如下圖。
其中,Individual scores for each paticipant列出了每一個研究對象的情況,而Total count data (frequencies)則是對相同情況研究對象的數(shù)據(jù)進行了匯總。
二、對問題的分析
要檢驗三組或多組相關(guān)樣本中,分類變量是否存在差異,可以使用Cochran's Q 檢驗,但需要考慮以下4個假設(shè)。
假設(shè)1:結(jié)局變量為二分類,且兩類之間互斥。互斥是指一個研究對象只能在一個分組中,不可能同時出現(xiàn)在兩個組中。例如 “安全”和“不安全”,“及格”和“不及格”等。
假設(shè)2:分組變量包含3個及以上分類,且各組之間相關(guān)。(當分組變量只有2個分類時,可使用McNemar’s檢驗)
假設(shè)3:樣本是來自于研究人群的隨機樣本。然而實際中,樣本并非都是隨機樣本。
假設(shè)4:樣本量足夠。當樣本量n≥4且nk≥24(k為分組變量數(shù))時,可以采用Cochran's Q檢驗;否則采用“精確” Cochran's Q檢驗。
本研究中,結(jié)局變量有兩個分組且互斥(“通過”和“不通過”),符合假設(shè)1;分組變量包含3個分類(開始康復(fù)、康復(fù)3個月和康復(fù)6個月時),各組之間相關(guān),符合假設(shè)2;研究對象是隨機選取,符合假設(shè)3。
那么應(yīng)該如何檢驗假設(shè)4,并進行比較呢?
三、SPSS操作
3.1 檢驗假設(shè)4:樣本量足夠
1. 轉(zhuǎn)換數(shù)據(jù)格式
如果原始數(shù)據(jù)格式是Total count data (frequencies),則可以跳過此步。如果原始數(shù)據(jù)格式是Individual scores for each paticipant,則需要將數(shù)據(jù)轉(zhuǎn)換成Total count data (frequencies)格式。
在主界面點擊Data→Aggregate,出現(xiàn)Aggregate Data對話框。將變量initial_fitness_test、month3_fitness_test和final_fitness_test選入Break Variable(s)框中。
點擊下方Number of cases框,并在Name框中填入“freq”。在Save下方勾選Create a new dataset containing only the aggregated variables,并在Dataset name框中填入新數(shù)據(jù)集的名字(例如“cochran_q_freq”)。
點擊OK,產(chǎn)生新數(shù)據(jù)集。在新數(shù)據(jù)集中,可以看到新變量“freq”,代表每一種自變量組合的頻數(shù)。
2. 數(shù)據(jù)加權(quán)
使用Total count data (frequencies)格式數(shù)據(jù),并在主界面點擊Data→Weight Cases,彈出Weight Cases對話框后,點擊Weight cases by,激活Frequency Variable窗口。將freq變量放入Frequency Variable欄,點擊OK。
3. 計算樣本量
本研究的總樣本數(shù)N=63,但計算Cochran's Q 檢驗的樣本量時,需要減去三次測試結(jié)果都一致的樣本數(shù)。如下突出顯示所示,全部為“Failed”有20例,全部為“Passed”有7例,所以三次測試結(jié)果都一致的樣本數(shù)為20+7=27,Cochran's Q 檢驗的樣本量n=63-27=36。
其次,需要確定nk的大小。由于本研究共有三個分組,所以k=3,nk=36*3=108。
綜上,n≥4且nk≥24,符合假設(shè)4。
3.2 計算比例
在主界面點擊Descriptive Statistics→Frequencies,在Frequencies對話框中,將變量initial_fitness_test、month3_fitness_test和final_fitness_test選入Variable(s):框中,點擊OK。
3.3 符合假設(shè)4的Cochran's Q檢驗
在主界面點擊Analyze→Nonparametric Tests→Related Samples,出現(xiàn)Nonparametric Tests: Two or More Related Samples對話框。確認在What is your objective?區(qū)域勾選了Automatically compare observed data to hypothesized。
點擊Fields,將變量initial_fitness_test、month3_fitness_test和final_fitness_test選入Test Fields框中。
點擊Settings→Customize tests,勾選Cochran's Q (k samples)。
點擊Define Success,在Cochran's Q: Define Success對話框中,點擊Combine values into success category,在Success框中填入1(這里是“成功”對應(yīng)的編碼,本例中即為通過體能測試,“Passed”對應(yīng)的是1,所以這里填“1”)。
點擊OK→Run,輸出結(jié)果。
3.4 不符合假設(shè)4的“精確”Cochran's Q檢驗
當不符合假設(shè)4時,需要使用“精確”Cochran's Q檢驗。在主界面點擊Analyze→Nonparametric Tests→Legacy Dialogs→K Related Samples,出現(xiàn)Tests for Several Related Samples對話框。
將變量initial_fitness_test、month3_fitness_test和final_fitness_test選入Test Variables框中。在Test Type 下方去掉Friedman,然后勾選Cochran's Q。(如果數(shù)據(jù)符合假設(shè)4,則此時點擊OK,結(jié)果與3.3部分的操作結(jié)果一致)
點擊Exact,在Exact Tests對話框中,點擊Exact,點擊Continue→OK。
3.5 “精確”Cochran's Q檢驗后的兩兩比較
對于符合假設(shè)4的Cochran's Q檢驗(3.3部分),事后的兩兩比較將在結(jié)果解釋部分展示(4.2部分)。
對于不符合假設(shè)4的“精確”Cochran's Q檢驗(3.4部分)事后的兩兩比較,可采用經(jīng)Bonferroni法校正的多重McNemar檢驗。
在主界面點擊Analyze→Nonparametric Tests→Legacy Dialogs→2 Related Samples。在Two-Related-Samples Tests對話框中,依次選擇兩兩比較的變量,分別將變量initial_fitness_test和month3_fitness_test、變量initial_fitness_test和final_fitness_test、變量month3_fitness_test和final_fitness_test選入右側(cè)Test Pairs中。 去掉Test Type下方的Wilcoxon,勾選McNemar。
點擊Exact,在Exact Tests對話框中,點擊Exact,點擊Continue→OK。
四、結(jié)果解釋
4.1 統(tǒng)計描述
3.2部分的操作后,得到的頻數(shù)結(jié)果見下圖??祻?fù)開始、康復(fù)3個月和康復(fù)6個月時培的體能測試的通過率分別為22.2%、44.4% 和 60.3%。
4.2 符合假設(shè)4的Cochran's Q檢驗及事后兩兩比較
3.3部分的操作后,得到Cochran's Q檢驗的結(jié)果如下圖。
上圖中,第一列(Null Hypothesis)是本研究的零假設(shè)。第二列(Test)顯示本研究的假設(shè)檢驗方法,即Cochran's Q檢驗。第三列(Sig.)是假設(shè)檢驗的統(tǒng)計結(jié)果,即P值。第四列(Decision)是根據(jù)假設(shè)檢驗做出的判斷,即判斷是否拒絕零假設(shè)。
本研究Cochran's Q檢驗的P<0.001,拒絕零假設(shè)。即開始康復(fù)、康復(fù)3個月和康復(fù)6個月時,研究對象體能測試結(jié)果的差異具有統(tǒng)計學(xué)意義。
雙擊該表,SPSS會自動彈出Model Viewer界面,幫助我們進一步了解Hypothesis Test Summary表的結(jié)果。
Cochran's Q檢驗統(tǒng)計量服從自由度為k-1的 χ2分布。本研究的統(tǒng)計量為24.222,此時統(tǒng)計量可記為 χ2 = 24.222, P<0.001。
在該視圖下方的View的下拉選項框中,選擇“Pairwise Comparisons”,可以得到兩兩比較的結(jié)果。兩兩比較的方法為Dunn’s檢驗(經(jīng)Bonferroni法校正)。
在Pairwise Comparisons圖中(此處略),連接線代表兩兩比較的結(jié)果,黑色連接線代表兩組間差異無統(tǒng)計學(xué)意義,橘黃色連接線代表兩組差異具有統(tǒng)計學(xué)意義。
下方的表格(如下圖)給出了更多的信息:比較的組別、統(tǒng)計量、標準誤、標準化的統(tǒng)計量(=統(tǒng)計量/標準誤)、P值和調(diào)整后的P值。
由于是事后的兩兩比較(Post hoc test),因此需要調(diào)整顯著性水平(調(diào)整α水平),作為判斷兩兩比較的顯著性水平。依據(jù)Bonferroni法,調(diào)整α水平=原α水平÷比較次數(shù)。本研究共比較了3次,調(diào)整α水平=0.05÷3=0.0167。因此,最終得到的P值(上圖中Sig.一列),需要和0.0167比較,小于0.0167則認為差異有統(tǒng)計學(xué)意義。
另外,SPSS也提供了調(diào)整后P值(上圖中Adj. Sig.一列),其思想還是采用Bonferroni法調(diào)整α水平。該列是將原始P值乘以比較次數(shù)得到,因此可以直接和0.05比較,小于0.05則認為差異有統(tǒng)計學(xué)意義。
以上結(jié)果可以描述為:康復(fù)開始和康復(fù)3個月時研究對象體能測試結(jié)果的差異有統(tǒng)計學(xué)意義(調(diào)整后P=0.013),康復(fù)開始和康復(fù)6個月時研究對象體能測試結(jié)果的差異有統(tǒng)計學(xué)意義(調(diào)整后P<0.001),而康復(fù)3個月和康復(fù)6個月時研究對象體能測試結(jié)果的差異無統(tǒng)計學(xué)意義。
4.3 不符合假設(shè)4的“精確”Cochran's Q檢驗
3.4部分的操作中,既可以得到Cochran's Q檢驗的結(jié)果,也可以得到“精確”Cochran's Q檢驗的結(jié)果(取決于是否選擇Exact選項)。
結(jié)果如下圖。在Test Statistics表格中,左側(cè)是Cochran's Q檢驗結(jié)果,右側(cè)是“精確”Cochran's Q檢驗結(jié)果。
如果數(shù)據(jù)符合假設(shè)4,則Cochran's Q檢驗統(tǒng)計量服從自由度為k-1的 χ2分布。左側(cè)表格中的P值為“Asymp. Sig.”所對應(yīng)的“0.000”,即P<0.001。本研究的統(tǒng)計量為24.222,此時統(tǒng)計量可記為 χ2 = 24.222,P<0.001。
如果數(shù)據(jù)不符合假設(shè)4,則右側(cè)表格中的P值為“Exact. Sig.”所對應(yīng)的“0.000”,即P<0.001。本研究的統(tǒng)計量為24.222,此時統(tǒng)計量可記為Cochran's Q = 24.222, P<0.001。
4.4 “精確”Cochran's Q檢驗后的兩兩比較
當不滿足假設(shè)4時,3.5部分的操作可得到經(jīng)Bonferroni法校正的多重McNemar檢驗的結(jié)果。
由于是事后的兩兩比較(Post hoc test),因此需要調(diào)整顯著性水平(調(diào)整α水平),作為判斷兩兩比較的顯著性水平。依據(jù)Bonferroni法,調(diào)整α水平=原α水平÷比較次數(shù)。本研究共比較了3次,調(diào)整α水平=0.05÷3=0.0167。因此,最終得到的P值(上圖中Exact Sig. (2-tailed)一行),需要和0.0167比較,小于0.0167則認為差異有統(tǒng)計學(xué)意義。
以上結(jié)果可以描述為:康復(fù)開始和康復(fù)3個月時研究對象體能測試結(jié)果的差異有統(tǒng)計學(xué)意義(P=0.007),康復(fù)開始和康復(fù)6個月時研究對象體能測試結(jié)果的差異有統(tǒng)計學(xué)意義(P<0.001),而康復(fù)3個月和康復(fù)6個月時研究對象體能測試結(jié)果的差異無統(tǒng)計學(xué)意義。
五、撰寫結(jié)論
1. 符合假設(shè)4時(即樣本量足夠)
開始康復(fù)、康復(fù)3個月和康復(fù)6個月時,卒中后患者體能測試的通過率分別為22.2%、44.4%和60.3%。運用Cochran's Q 檢驗對三個時間點體能測試通過率進行檢驗,三個時間點通過率的差異具有統(tǒng)計學(xué)意義,χ2 = 24.222, P<0.001。
采用Dunn’s檢驗(經(jīng)Bonferroni法校正)進行事后的兩兩比較,康復(fù)開始和康復(fù)3個月時研究對象體能測試結(jié)果的差異有統(tǒng)計學(xué)意義(調(diào)整后P=0.013),康復(fù)開始和康復(fù)6個月時研究對象體能測試結(jié)果的差異有統(tǒng)計學(xué)意義(調(diào)整后P<0.001),而康復(fù)3個月和康復(fù)6個月時研究對象體能測試結(jié)果的差異無統(tǒng)計學(xué)意義(調(diào)整后P=0.124)。
2. 不符合假設(shè)4時
開始康復(fù)、康復(fù)3個月和康復(fù)6個月時,卒中后患者體能測試的通過率分別為22.2%、44.4%和60.3%。運用Cochran's Q 檢驗對三個時間點體能測試通過率進行檢驗,三個時間點通過率的差異具有統(tǒng)計學(xué)意義, Cochran's Q = 24.222, P<0.001。
運用“精確”McNemar’s檢驗進行事后的兩兩比較(經(jīng)Bonferroni法校正的α=0.0167)??祻?fù)開始和康復(fù)3個月時研究對象體能測試結(jié)果的差異有統(tǒng)計學(xué)意義(P=0.007),康復(fù)開始和康復(fù)6個月時研究對象體能測試結(jié)果的差異有統(tǒng)計學(xué)意義(P<0.001),而康復(fù)3個月和康復(fù)6個月時研究對象體能測試結(jié)果的差異無統(tǒng)計學(xué)意義(P=0.031)。
推薦學(xué)習(xí)書籍
《CDA一級教材》適合CDA一級考生備考,也適合業(yè)務(wù)及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計已有10萬+在讀~
免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10