
SPSS詳細教程:相對危險度(RR)的計算
一、問題與數(shù)據(jù)
研究者想探索吸煙與肺癌間的關(guān)聯(lián),即吸煙者患肺癌的風險是否比不吸煙者高以及高多少。研究者從一般人群中隨機抽樣700名調(diào)查對象建立前瞻性隊列研究。調(diào)查對象的吸煙狀態(tài)為吸煙或不吸煙。在研究開始時,所有調(diào)查對象均未患肺癌。研究者隨訪10年記錄調(diào)查對象是否患肺癌。
因此,研究者可以分別得到患肺癌的吸煙者、未患肺癌的吸煙者、患肺癌的不吸煙者和未患肺癌的不吸煙者的人數(shù),據(jù)此可以計算吸煙組與不吸煙組的風險差異。
本例中代表吸煙狀態(tài)的變量為smoking_status,吸煙賦值為1,不吸煙賦值為2;代表隨訪期肺癌發(fā)病與否的變量為lung_cancer,患肺癌賦值為1,未患肺癌賦值為2。
部分數(shù)據(jù)截圖如下,左側(cè)為原始數(shù)據(jù),右側(cè)為按不同吸煙狀態(tài)和患肺癌與否統(tǒng)計的匯總數(shù)據(jù)。
二、對問題的分析
為計算相對危險度(RR),需要滿足以下假設(shè):
假設(shè)1:因變量和自變量均為二分類變量。
假設(shè)2:各觀測間相互獨立。
接下來將詳細介紹如何計算相對危險度。
三、SPSS操作
1. 數(shù)據(jù)準備
如果研究者使用原始數(shù)據(jù),則跳過數(shù)據(jù)準備步驟,直接計算相對危險度;如果使用按不同吸煙狀態(tài)和患肺癌與否來統(tǒng)計得到匯總數(shù)據(jù),則需要添加權(quán)重,步驟如下。
(1)點擊主菜單Data > Weight Cases,如下圖:
點擊后出現(xiàn)Weight Cases對話框,如下圖:
(2)勾選Weight cases by選項,激活 鍵和Frequency Variable: 框,如下圖:
(3)將變量freq選入Frequency Variable框,如下圖:
(4)點擊OK鍵,為數(shù)據(jù)加權(quán)。
2. 相對危險度的SPSS操作
(1)點擊主菜單Analyze > Descriptive Statistics > Crosstabs,如下圖:
點擊后出現(xiàn)Crosstabs對話框,如下圖:
注意:如果使用頻數(shù)統(tǒng)計的數(shù)據(jù)文件,Crosstabs對話框如下圖:
(2)將自變量smoking_status選入Row(s)框,因變量lung_cancer選入Column(s)框,如下圖:
注意:如果使用頻數(shù)統(tǒng)計的數(shù)據(jù)文件,Crosstabs對話框如下圖:
(3)點擊Statistics鍵,出現(xiàn)Crosstabs:Statistics對話框,如下圖:
(4)勾選Risk,如下圖:
(5)點擊Continue鍵,返回Crosstabs對話框。
(6)點擊Cells鍵,出現(xiàn)Crosstabs:Cell Display對話框,如下圖:
(7)勾選Percentanges區(qū)域的Row,如下圖:
(8)點擊Continue鍵,返回Crosstabs對話框。
(9)點擊OK鍵,生成結(jié)果。
四、結(jié)果解釋
1. 描述性統(tǒng)計分析
在報告相對危險度前,研究者應(yīng)該先查看基本的一些統(tǒng)計量,了解數(shù)據(jù)特征。本例中在smoking_status*lung_cancer Crosstabulation表,如下圖:
首先,表中可看到在350名吸煙者中患肺癌的人數(shù),如下圖高亮:
隨訪期間29名吸煙者患肺癌,即8.3%(29÷350*100%=8.3%)的吸煙者患肺癌。
注意:表中僅保留了一位小數(shù),SPSS會自動計算相對危險度;如果研究者想得到更多小數(shù)位數(shù)手動計算的相對危險度,則雙擊smoking_status*lung_cancer Crosstabulation表,如下圖??捎^察到8.3%變?yōu)?.285714%。
其次,還能看到350名不吸煙者中患肺癌的人數(shù),如下圖:
隨訪期間9名不吸煙者患肺癌,即2.6%(9÷350*100%=2.6%)的不吸煙者患肺癌。研究者想得到更多小數(shù)位數(shù)手動計算的相對危險度,也可以如上操作,2.6%變?yōu)?.571429%,如下圖:
從smoking_status*lung_cancer Crosstabulation表中可以得到初步結(jié)論:與不吸煙者相比,吸煙者患肺癌的風險更高。
研究者可以匯報:本研究隨機抽樣700名調(diào)查對象,吸煙者和不吸煙者各350名,吸煙者患肺癌的比例(8.3%)高于不吸煙者(2.6%)。
當然,研究者也可以選擇分別匯報患肺癌的吸煙者、未患肺癌的吸煙者、患肺癌的不吸煙者和未患肺癌的不吸煙者的人數(shù)。
2. 相對危險度
相對危險度結(jié)果可以在Risk Table表中查看,如下圖高亮顯示。
注意:表中高亮顯示的為“For cohort lung_cancer=Yes”行,不是“For cohort lung_cancer=No”,因為研究者感興趣的是吸煙對患肺癌的影響。
吸煙者患肺癌的相對危險度是3.222,95%置信區(qū)間為1.548到6.707。95%置信區(qū)間說明研究者有95%的把握說明人群中真實的相對危險度在1.548和6.707間。
如果研究者手動計算相對危險度,則需要吸煙者患肺癌的比例即0.08285714和不吸煙者患肺癌的比例即0.02571429。將兩個比例輸入到相對危險度計算公式,如下圖:
如果相對危險度大于1且95%置信區(qū)間不包括1,說明暴露組發(fā)生疾病的風險高于非暴露組,是結(jié)局的危險因素。本例中相對危險度3.222說明吸煙者患肺癌的風險高出不吸煙者222%。研究者還可以計算超額危險度,公式如下,其中RR為相對危險度。
本例中,超額危險度則為:
如果相對危險度小于1且95%置信區(qū)間不包括1,則意味著暴露組患病風險降低,是結(jié)局的保護因素。例如,相對危險度為0.34,代表與非暴露組相比,暴露組研究對象發(fā)生疾病的風險降低66%,計算如下。負號代表發(fā)生疾病的風險降低。
如果相對危險度的95%置信區(qū)間包括1,說明暴露組與非暴露組發(fā)生疾病的風險差異無統(tǒng)計學意義。
提示:研究者必須把自變量smoking_status選入Row(s),因變量lung_cancer選入Column(s)。如果選反,則會出現(xiàn)如下結(jié)果。
上表中相對危險度為1.574,95%置信區(qū)間上下限也分別變?yōu)?.297和1.910。因此,研究者需注意選對自變量和因變量。
綜上,研究者可以匯報:本研究隨機抽樣700名調(diào)查對象,吸煙者和不吸煙者各350名,吸煙者患肺癌的比例(8.3%)高于不吸煙者(2.6%)。與不吸煙者相比,吸煙者患肺癌的相對危險度為3.222(95%置信區(qū)間為1.548-6.707)。
五、撰寫結(jié)論
如果相對危險度95%置信區(qū)間不包括1,可以匯報:
本研究隨機抽樣700名調(diào)查對象,吸煙者和不吸煙者各350名,吸煙者患肺癌的比例(8.3%)高于不吸煙者(2.6%)。與不吸煙者相比,吸煙者患肺癌的相對危險度為3.222(95%置信區(qū)間為1.548-6.707),且有統(tǒng)計學意義。
如果相對危險度95%置信區(qū)間包括1,可以匯報(另外列舉一個例子):
有900名永久性房顫病人隨機分配至兩組,每組450名,一組使用降低腦卒中風險的新藥,另外一組使用常規(guī)藥物。使用新藥的房顫病人中11人(2.4%)患腦卒中,使用常規(guī)藥物病人24人(4.7%)患腦卒中。與使用常規(guī)藥物的房顫病人相比,使用新藥的病人患腦卒中的相對危險度為0.524(95%置信區(qū)間為0.256-1.074),沒有統(tǒng)計學意義。
推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業(yè)務(wù)及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計已有10萬+在讀~
免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03