
SPSS詳細(xì)教程:相對(duì)危險(xiǎn)度(RR)的計(jì)算
一、問題與數(shù)據(jù)
研究者想探索吸煙與肺癌間的關(guān)聯(lián),即吸煙者患肺癌的風(fēng)險(xiǎn)是否比不吸煙者高以及高多少。研究者從一般人群中隨機(jī)抽樣700名調(diào)查對(duì)象建立前瞻性隊(duì)列研究。調(diào)查對(duì)象的吸煙狀態(tài)為吸煙或不吸煙。在研究開始時(shí),所有調(diào)查對(duì)象均未患肺癌。研究者隨訪10年記錄調(diào)查對(duì)象是否患肺癌。
因此,研究者可以分別得到患肺癌的吸煙者、未患肺癌的吸煙者、患肺癌的不吸煙者和未患肺癌的不吸煙者的人數(shù),據(jù)此可以計(jì)算吸煙組與不吸煙組的風(fēng)險(xiǎn)差異。
本例中代表吸煙狀態(tài)的變量為smoking_status,吸煙賦值為1,不吸煙賦值為2;代表隨訪期肺癌發(fā)病與否的變量為lung_cancer,患肺癌賦值為1,未患肺癌賦值為2。
部分?jǐn)?shù)據(jù)截圖如下,左側(cè)為原始數(shù)據(jù),右側(cè)為按不同吸煙狀態(tài)和患肺癌與否統(tǒng)計(jì)的匯總數(shù)據(jù)。
二、對(duì)問題的分析
為計(jì)算相對(duì)危險(xiǎn)度(RR),需要滿足以下假設(shè):
假設(shè)1:因變量和自變量均為二分類變量。
假設(shè)2:各觀測(cè)間相互獨(dú)立。
接下來將詳細(xì)介紹如何計(jì)算相對(duì)危險(xiǎn)度。
三、SPSS操作
1. 數(shù)據(jù)準(zhǔn)備
如果研究者使用原始數(shù)據(jù),則跳過數(shù)據(jù)準(zhǔn)備步驟,直接計(jì)算相對(duì)危險(xiǎn)度;如果使用按不同吸煙狀態(tài)和患肺癌與否來統(tǒng)計(jì)得到匯總數(shù)據(jù),則需要添加權(quán)重,步驟如下。
(1)點(diǎn)擊主菜單Data > Weight Cases,如下圖:
點(diǎn)擊后出現(xiàn)Weight Cases對(duì)話框,如下圖:
(2)勾選Weight cases by選項(xiàng),激活 鍵和Frequency Variable: 框,如下圖:
(3)將變量freq選入Frequency Variable框,如下圖:
(4)點(diǎn)擊OK鍵,為數(shù)據(jù)加權(quán)。
2. 相對(duì)危險(xiǎn)度的SPSS操作
(1)點(diǎn)擊主菜單Analyze > Descriptive Statistics > Crosstabs,如下圖:
點(diǎn)擊后出現(xiàn)Crosstabs對(duì)話框,如下圖:
注意:如果使用頻數(shù)統(tǒng)計(jì)的數(shù)據(jù)文件,Crosstabs對(duì)話框如下圖:
(2)將自變量smoking_status選入Row(s)框,因變量lung_cancer選入Column(s)框,如下圖:
注意:如果使用頻數(shù)統(tǒng)計(jì)的數(shù)據(jù)文件,Crosstabs對(duì)話框如下圖:
(3)點(diǎn)擊Statistics鍵,出現(xiàn)Crosstabs:Statistics對(duì)話框,如下圖:
(4)勾選Risk,如下圖:
(5)點(diǎn)擊Continue鍵,返回Crosstabs對(duì)話框。
(6)點(diǎn)擊Cells鍵,出現(xiàn)Crosstabs:Cell Display對(duì)話框,如下圖:
(7)勾選Percentanges區(qū)域的Row,如下圖:
(8)點(diǎn)擊Continue鍵,返回Crosstabs對(duì)話框。
(9)點(diǎn)擊OK鍵,生成結(jié)果。
四、結(jié)果解釋
1. 描述性統(tǒng)計(jì)分析
在報(bào)告相對(duì)危險(xiǎn)度前,研究者應(yīng)該先查看基本的一些統(tǒng)計(jì)量,了解數(shù)據(jù)特征。本例中在smoking_status*lung_cancer Crosstabulation表,如下圖:
首先,表中可看到在350名吸煙者中患肺癌的人數(shù),如下圖高亮:
隨訪期間29名吸煙者患肺癌,即8.3%(29÷350*100%=8.3%)的吸煙者患肺癌。
注意:表中僅保留了一位小數(shù),SPSS會(huì)自動(dòng)計(jì)算相對(duì)危險(xiǎn)度;如果研究者想得到更多小數(shù)位數(shù)手動(dòng)計(jì)算的相對(duì)危險(xiǎn)度,則雙擊smoking_status*lung_cancer Crosstabulation表,如下圖??捎^察到8.3%變?yōu)?.285714%。
其次,還能看到350名不吸煙者中患肺癌的人數(shù),如下圖:
隨訪期間9名不吸煙者患肺癌,即2.6%(9÷350*100%=2.6%)的不吸煙者患肺癌。研究者想得到更多小數(shù)位數(shù)手動(dòng)計(jì)算的相對(duì)危險(xiǎn)度,也可以如上操作,2.6%變?yōu)?.571429%,如下圖:
從smoking_status*lung_cancer Crosstabulation表中可以得到初步結(jié)論:與不吸煙者相比,吸煙者患肺癌的風(fēng)險(xiǎn)更高。
研究者可以匯報(bào):本研究隨機(jī)抽樣700名調(diào)查對(duì)象,吸煙者和不吸煙者各350名,吸煙者患肺癌的比例(8.3%)高于不吸煙者(2.6%)。
當(dāng)然,研究者也可以選擇分別匯報(bào)患肺癌的吸煙者、未患肺癌的吸煙者、患肺癌的不吸煙者和未患肺癌的不吸煙者的人數(shù)。
2. 相對(duì)危險(xiǎn)度
相對(duì)危險(xiǎn)度結(jié)果可以在Risk Table表中查看,如下圖高亮顯示。
注意:表中高亮顯示的為“For cohort lung_cancer=Yes”行,不是“For cohort lung_cancer=No”,因?yàn)檠芯空吒信d趣的是吸煙對(duì)患肺癌的影響。
吸煙者患肺癌的相對(duì)危險(xiǎn)度是3.222,95%置信區(qū)間為1.548到6.707。95%置信區(qū)間說明研究者有95%的把握說明人群中真實(shí)的相對(duì)危險(xiǎn)度在1.548和6.707間。
如果研究者手動(dòng)計(jì)算相對(duì)危險(xiǎn)度,則需要吸煙者患肺癌的比例即0.08285714和不吸煙者患肺癌的比例即0.02571429。將兩個(gè)比例輸入到相對(duì)危險(xiǎn)度計(jì)算公式,如下圖:
如果相對(duì)危險(xiǎn)度大于1且95%置信區(qū)間不包括1,說明暴露組發(fā)生疾病的風(fēng)險(xiǎn)高于非暴露組,是結(jié)局的危險(xiǎn)因素。本例中相對(duì)危險(xiǎn)度3.222說明吸煙者患肺癌的風(fēng)險(xiǎn)高出不吸煙者222%。研究者還可以計(jì)算超額危險(xiǎn)度,公式如下,其中RR為相對(duì)危險(xiǎn)度。
本例中,超額危險(xiǎn)度則為:
如果相對(duì)危險(xiǎn)度小于1且95%置信區(qū)間不包括1,則意味著暴露組患病風(fēng)險(xiǎn)降低,是結(jié)局的保護(hù)因素。例如,相對(duì)危險(xiǎn)度為0.34,代表與非暴露組相比,暴露組研究對(duì)象發(fā)生疾病的風(fēng)險(xiǎn)降低66%,計(jì)算如下。負(fù)號(hào)代表發(fā)生疾病的風(fēng)險(xiǎn)降低。
如果相對(duì)危險(xiǎn)度的95%置信區(qū)間包括1,說明暴露組與非暴露組發(fā)生疾病的風(fēng)險(xiǎn)差異無統(tǒng)計(jì)學(xué)意義。
提示:研究者必須把自變量smoking_status選入Row(s),因變量lung_cancer選入Column(s)。如果選反,則會(huì)出現(xiàn)如下結(jié)果。
上表中相對(duì)危險(xiǎn)度為1.574,95%置信區(qū)間上下限也分別變?yōu)?.297和1.910。因此,研究者需注意選對(duì)自變量和因變量。
綜上,研究者可以匯報(bào):本研究隨機(jī)抽樣700名調(diào)查對(duì)象,吸煙者和不吸煙者各350名,吸煙者患肺癌的比例(8.3%)高于不吸煙者(2.6%)。與不吸煙者相比,吸煙者患肺癌的相對(duì)危險(xiǎn)度為3.222(95%置信區(qū)間為1.548-6.707)。
五、撰寫結(jié)論
如果相對(duì)危險(xiǎn)度95%置信區(qū)間不包括1,可以匯報(bào):
本研究隨機(jī)抽樣700名調(diào)查對(duì)象,吸煙者和不吸煙者各350名,吸煙者患肺癌的比例(8.3%)高于不吸煙者(2.6%)。與不吸煙者相比,吸煙者患肺癌的相對(duì)危險(xiǎn)度為3.222(95%置信區(qū)間為1.548-6.707),且有統(tǒng)計(jì)學(xué)意義。
如果相對(duì)危險(xiǎn)度95%置信區(qū)間包括1,可以匯報(bào)(另外列舉一個(gè)例子):
有900名永久性房顫病人隨機(jī)分配至兩組,每組450名,一組使用降低腦卒中風(fēng)險(xiǎn)的新藥,另外一組使用常規(guī)藥物。使用新藥的房顫病人中11人(2.4%)患腦卒中,使用常規(guī)藥物病人24人(4.7%)患腦卒中。與使用常規(guī)藥物的房顫病人相比,使用新藥的病人患腦卒中的相對(duì)危險(xiǎn)度為0.524(95%置信區(qū)間為0.256-1.074),沒有統(tǒng)計(jì)學(xué)意義。
推薦學(xué)習(xí)書籍
《CDA一級(jí)教材》適合CDA一級(jí)考生備考,也適合業(yè)務(wù)及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計(jì)已有10萬+在讀~
免費(fèi)加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10