
SPSS操作:多項測量指標的ROC曲線分析
在前面幾講中,我們已向大家介紹過如何依據(jù)一項測量指標設(shè)計和評價診斷試驗。但在實際臨床工作中,我們往往是根據(jù)多項指標綜合判斷病情的。比如,在診斷高血壓時,我們會根據(jù)年齡、性別、并發(fā)癥等多個因素同時評價受試者的患病情況。那么在這種情況下,我們應(yīng)如何判斷診斷結(jié)果的真實性呢?
一、問題與數(shù)據(jù)
某呼吸內(nèi)科醫(yī)生擬通過性別、年齡、BMI、COPD病史和是否吸煙等因素預(yù)測受試者的肺癌患病情況。他招募了85名肺癌患者,259名非肺癌患者,并通過查閱病歷、問卷調(diào)查的方式收集了上述信息。變量的賦值和部分原始數(shù)據(jù)見表1和表2。如果該醫(yī)生依據(jù)這幾項因素預(yù)測受試者是否患肺癌,那么應(yīng)如何預(yù)測,準確性又如何呢?
表1 肺癌危險因素分析研究的變量與賦值
表2 部分原始數(shù)據(jù)
從本質(zhì)上講,該研究也是結(jié)局變量為二分類的診斷試驗。但是該診斷試驗的測量指標很多,應(yīng)該如何預(yù)測每一位受試者是否患肺癌呢?
我們可以通過二分類Logistic回歸模型,用性別、年齡、BMI、COPD病史和是否吸煙等因素,計算受試者患肺癌的預(yù)測概率。
二、SPSS分析方法
1. 數(shù)據(jù)錄入SPSS
2. Logistic回歸分析(關(guān)于Logistic回歸每一步設(shè)置的意義,可參考“SPSS實例教程:二分類Logistic回歸”。)
選擇Analyze→Regression→Binary Logistic
(1)主對話框設(shè)置
將因變量cancer送入Dependent框中,將納入模型的自變量sex, age, BMI和COPD變量Covariates中,選擇Forward: LR的自變量篩選方法(Method對話框)。
(2)Categorical設(shè)置
本研究中,COPD是多分類變量,我們指定“無COPD病史”的研究對象為參照組,分別比較“輕/中度”和“重度”組相對于參照組患肺癌的風險。
點擊Categorical→將左側(cè)Covariates中的COPD變量送入右側(cè)Categorical Covariates中。在Reference Category的右側(cè)選擇First(表示選擇變量COPD中,賦值最小的,即“0”作為參照。)→點擊Change→點擊Continue。
(3)Save設(shè)置
點擊Save→選擇Probabilities→點擊Continue。
三、Logistic回歸結(jié)果
1. 納入Logistic回歸模型的變量
最終模型納入了性別(sex)、COPD病史(COPD)和吸煙(smoke)三個變量。也就是說,這該Logistic回歸模型認為,這三個變量可以預(yù)測是否患肺癌,而年齡和BMI并沒有預(yù)測意義。
2. 個體患肺癌的概率
根據(jù)上述Logistic回歸的結(jié)果,我們可以寫出每個受試者根據(jù)性別、COPD病史和是否吸煙三個因素,預(yù)測是否患肺癌的危險得分Logit(P):
Logit(P)= -3.062 + 0.836*sex(男=1;女=0) + 0.454*COPD(輕度) + 1.281COPD(中/重度) + 1.237*smoke(無=0;曾吸/現(xiàn)吸=1)
并可以按照以下公式計算得到每一個受試者患肺癌的預(yù)測概率:
實際上,當點選了上述2.5的操作,運行該回歸分析后,SPSS會自動生成每一位受試者的預(yù)測概率(PRE_1),而不需要上述的手工計算。
至此,我們就可以根據(jù)受試者的真實患病情況和預(yù)測概率,評估根據(jù)性別、COPD病史和是否吸煙三個因素,預(yù)測個體是否患肺癌的準確性了。
四、ROC曲線的繪制
1. 選擇Analyze→ROC Curve
2. 主對話框設(shè)置
將已知的疾病情況cancer送入State Variable框中,預(yù)測概率Predicted probability送入Test Variable中,并在Value of State Variable框中填1→OK。
五、結(jié)果解讀
SPSS的ROC曲線結(jié)果會給出ROC曲線和曲線下面積。
根據(jù)結(jié)果,我們可以知道該診斷試驗的ROC曲線下面積是0.718,判斷其準確性,并用于與其他診斷試驗的比較。至于評價診斷試驗的其它指標,需要我們根據(jù)預(yù)測概率(PRE_1)確定診斷截點(cut-off值)后再計算,有興趣的小伙伴可以自己嘗試計算哦。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03