
SPSS詳細(xì)操作:獨(dú)立樣本四格表的卡方檢驗(yàn)
如果我想看不同患者人群的術(shù)后復(fù)發(fā)率有沒有差異,怎么辦?這時(shí)候就需要?dú)g迎我們的統(tǒng)計(jì)小助手——卡方檢驗(yàn)閃亮登場(chǎng)啦!
卡方檢驗(yàn)可是一位重量級(jí)選手,凡是涉及到計(jì)數(shù)資料分布的比較都需要他的幫忙。和t檢驗(yàn)一樣,卡方檢驗(yàn)也會(huì)用在成組和配對(duì)設(shè)計(jì)資料分析中,本期我們一起聊聊獨(dú)立樣本四格表的χ2檢驗(yàn)。
一、問題與數(shù)據(jù)
用藥物A治療急性心肌梗死患者198例,24小時(shí)內(nèi)死亡11例,病死率為5.56%,另42例治療時(shí)采用藥物B,24小時(shí)內(nèi)死亡6例,病死率為14.29%,提問:兩組病死率有無差別?
表1. 兩種藥物急性心肌梗塞患者治療后24小時(shí)內(nèi)死亡情況
二、對(duì)數(shù)據(jù)結(jié)構(gòu)的分析
“生存”,還是“死亡”,這是個(gè)問題,但更是一個(gè)典型的二分類結(jié)局指標(biāo),我們關(guān)注的重點(diǎn)是兩種藥物治療后“生存”和“死亡”的分布(或者說病死率)有無差別,由此組成的2*2列聯(lián)表就是χ2檢驗(yàn)中經(jīng)典的“四格表”(如表1)。
下面一起看看SPSS怎樣搞定χ2檢驗(yàn)。
三、SPSS分析方法
1. 數(shù)據(jù)錄入
(1) 變量視圖
(2) 數(shù)據(jù)視圖
2. 加權(quán)個(gè)案:選擇Data→weight cases→勾選Weight cases by,將頻數(shù)放入Frequency Variable→OK。因?yàn)楸纠袛?shù)據(jù)庫(kù)每一行代表多個(gè)觀測(cè)對(duì)象,所以需要對(duì)其進(jìn)行加權(quán)處理。
當(dāng)然,如果數(shù)據(jù)是以單個(gè)觀測(cè)對(duì)象的形式,即每一行代表1個(gè)觀測(cè)對(duì)象,則無需加權(quán)(如下圖)。
3. 選擇Analyze→Descriptive Statistics→Crosstabs
4. 選項(xiàng)設(shè)置
(1) 主對(duì)話框設(shè)置:將分組變量Drug放入Row(s)框中→將指標(biāo)變量Outcome放入Column(s)框中(實(shí)際上χ2檢驗(yàn)是關(guān)注實(shí)際和理論頻數(shù)是否一致,這里Row(s)框和Column(s)框內(nèi)變量也可以顛倒放,并不影響最終結(jié)果)。
(2) Statistics設(shè)置:勾選Chi-square,確定使用成組計(jì)數(shù)資料的卡方檢驗(yàn)→Continue
(3) Cells設(shè)置:Counts中勾選Observed和Expected,輸出實(shí)際觀測(cè)頻數(shù)和理論頻數(shù);Percentages中勾選Row,輸出每組轉(zhuǎn)歸百分比→Continue→OK
四、結(jié)果解讀
表2 統(tǒng)計(jì)匯總
表2中不僅有服用兩種藥物后患者實(shí)際轉(zhuǎn)歸(生存/死亡)的頻數(shù)和相應(yīng)百分比,還輸出了相應(yīng)的理論頻數(shù)(所在行列合計(jì)數(shù)乘積/總例數(shù))。需要注意的是,這里的理論頻數(shù)和總例數(shù)直接決定了下面卡方檢驗(yàn)結(jié)果的選擇。
表3 卡方檢驗(yàn)結(jié)果
表3中這么多檢驗(yàn)結(jié)果,到底看哪一個(gè)?不要著急 ,我們一個(gè)一個(gè)來看:
1、總例數(shù)≥40,所有理論頻數(shù)≥5,看Pearson Chi-Square結(jié)果;
2、總例數(shù)≥40,出現(xiàn)1個(gè)理論頻數(shù)≥1且<5,χ2檢驗(yàn)需進(jìn)行連續(xù)性校正,這時(shí)以Continuity Correction結(jié)果為準(zhǔn);
3、總例數(shù)≥40,至少2個(gè)理論頻數(shù)≥1且<5,看Fisher’s Exact Test結(jié)果;
4、總例數(shù)<40或者出現(xiàn)理論頻數(shù)<1,看Fisher’s Exact Test結(jié)果。
( SPSS也會(huì)友好地在表格下方的注釋部分提示是否有理論頻數(shù)小于5,以及最小的理論頻數(shù)是多少,方便選擇恰當(dāng)?shù)臋z驗(yàn)方法)
本例中總例數(shù)=240>40,存在1個(gè)理論頻數(shù)=3.0<5,所以需要看Continuity Correction結(jié)果,χ2=2.796,P=0.095>0.05。
五、撰寫結(jié)論
兩種藥物治療急性心肌梗塞患者的預(yù)后并不相同,A藥病死率為5.6%,低于 B藥(14.3%),但差異無統(tǒng)計(jì)學(xué)意義(χ2=2.796,P=0.095)。
六、延伸閱讀
1、χ2檢驗(yàn)是基于χ2分布的一種假設(shè)檢驗(yàn),簡(jiǎn)單講就是想看看實(shí)際觀測(cè)數(shù)和理論頻數(shù)偏離程度。比如說,上面提到的例子中服用A藥后共觀察到187例存活,這里的187例就是“實(shí)際觀測(cè)數(shù)”,對(duì)應(yīng)的“理論頻數(shù)”是187所在行列合計(jì)的乘積與總例數(shù)的比值,也就是198*223/240=184。所有單元格的實(shí)際觀測(cè)數(shù)和理論頻數(shù)計(jì)算出后,可根據(jù)如下公式計(jì)算χ2,得到相應(yīng)的P值。
χ2=∑[(實(shí)際觀測(cè)數(shù)-理論頻數(shù))2/理論頻數(shù)],ν=(行數(shù)-1)*(列數(shù)-1)
χ2檢驗(yàn)的原假設(shè)是實(shí)際觀測(cè)數(shù)和理論頻數(shù)分布一致,如果P<0.05,那么拒絕原假設(shè),認(rèn)為實(shí)際觀測(cè)數(shù)和理論頻數(shù)分布是不一致的,也就是A藥和B藥治療后的轉(zhuǎn)歸是不同的。當(dāng)然有了統(tǒng)計(jì)分析軟件,我們就不需要這么辛苦的計(jì)算啦。
2、如果χ2檢驗(yàn)所得P值在0.05左右,或者總例數(shù)較小,理論頻數(shù)較少時(shí),給出的結(jié)論一定要謹(jǐn)慎,不要簡(jiǎn)單給出P>0.05或者P<0.05,靠譜兒的做法是給出明確的P值。另外,利用列聯(lián)表χ2檢驗(yàn)比較不同患者某種治療結(jié)局有無差別時(shí),還應(yīng)該評(píng)估不同組患者是否“同質(zhì)”。舉個(gè)例子,患者病情嚴(yán)重程度是否一致,這些特征都可能會(huì)影響最終結(jié)果的判斷,對(duì)于這一類問題,可以考慮分層χ2檢驗(yàn),logistic回歸進(jìn)行處理,這些后面我們接著聊~~~
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03