
作者:丁點helper
來源:丁點幫你
前文,我們對Logistic回歸分析的來龍去脈有了一個基本的了解,但是Logistic回歸之所以應用十分廣泛還有一個重要的原因——能直接輸出OR值?
什么是OR值?如何理解?我們今天就來好好看一看。
怎么理解OR值
多重線性回歸,一般是指有多個自變量X,只有一個因變量Y。前面我們主要是以簡單線性回歸為例在介紹,兩者的差距主要在于自變量X的數(shù)量,在只有一個X時,就稱簡單線性回歸。
OR值是《流行病學》中的重要概念,稱作“優(yōu)勢比”(odds ratio),也稱“比值比”,反映的是某種暴露與結局的關聯(lián)強度。
這句話初學者看起來可能會特別費勁:什么叫優(yōu)勢?優(yōu)勢比又是什么意思?暴露和結局又該怎么理解?我們結合例子把這些問題一一理清。
案例:我們想探討吸煙是否會導致糖尿病的發(fā)生。一種很實用的思路是找兩組人群,一組患有糖尿病,另一種不患糖尿病,然后,分別調查這兩組人群哪些人吸煙、哪些人不吸。
通過調查我們獲得如下數(shù)據(jù):
結合上表,可以看到,患病組一共有40人,其中24人吸煙,16人不吸煙。我們就稱“吸煙”是一種“暴露”。
所以,“暴露”具有十分廣泛的定義,一般某些研究對象具有我們感興趣的因素,就稱這些研究對象為“暴露組”。
暴露包括各種特征(如性別、年齡、教育程度等),以及某種特定的行為(如飲酒、不愛運動等),或接觸某種有毒、有害物質(如PM2.5等),而不具備這些因素的對象稱為“非暴露組”。
所謂研究“暴露對結局”的影響,這里的“結局”在本例中就指“是否患有糖尿病”,一般可以等同于我們前面說的“因變量Y”。
所謂的“優(yōu)勢”可以理解為“暴露比值”!那怎么理解暴露比值呢?
在本例中,對于患有糖尿病的對象,暴露比值為:吸煙的比例除以不吸煙的比例,即為:24/16 = 1.50;同樣,在不患有糖尿病的人群中,也可以計算一個吸煙的比例除以不吸煙的比例,即為:18/22 = 0.82。
把這兩個比例相除,就得到了吸煙與糖尿病相關關系的OR值,即OR = 1.50/0.82 = 1.83>1。由此,我們可以初步推斷,吸煙會加重患糖尿病的風險。
一般而言,OR值的意義可以總結如下(假設結局發(fā)生記為1,不發(fā)生記為0):
OR = 1,暴露與結局的無相關性;
OR > 1,暴露可以促進結局的發(fā)生;
OR < 1,暴露可以抑制結局事件的發(fā)生
Logistic很重要的意義就在于會直接輸出OR值,這一點甚至比看直接的回歸系數(shù)(β)還有意義。
OR值與回歸系數(shù)β的數(shù)量關系為:OR = eβ。在實際的應用中應該如何解讀OR值,我們結合一下文獻案例進行講解。
R值的應用分析
多重線性回歸,一般是指有多個自變量X,只有一個因變量Y。前面我們主要是以簡單線性回歸為例在介紹,兩者的差距主要在于自變量X的數(shù)量,在只有一個X時,就稱簡單線性回歸。
以下文章于2015年發(fā)表于《中國護理管理》,研究團隊主要采用Logistic回歸分析醫(yī)護人員“工作感受”的影響因素,研究的摘要截圖如下:
文章采用第五次國家衛(wèi)生服務調查問卷中有關工作感受的調查表,測量醫(yī)護人員工作感受情況:包括工作認知、工作滿意度、職業(yè)緊張和離職意愿4個維度。
該研究并沒有直接采用“工作感受”量表總得分進行研究,而是將上述4個維度分別作為“因變量(Y)”與其他因素,如性別、年齡、婚姻狀況、最高學歷、專業(yè)技術職稱(X)等進行Logistic回歸分析。
前文我們強調了進行Logistic回歸的基本條件是:Y是分類變量,本研究符合這個條件嗎?
符合。作者將“工作認知、工作滿意度、職業(yè)緊張和離職意愿”的量表得分換算成兩個類別:1=高,0=低,由此,這些因變量就是典型的二分類變量,從而可以進行Logistic回歸分析。
需要明確的是,該研究一共進行了四次分析,因為有四個因變量。自變量賦值表和Logistic分析表如下:
我們在分析Logistic回歸分析結果時,必須結合自變量的賦值情況來看,這是因為將“男性”賦值為“1”得到的結果與將“男性”賦值為“0”的結果會正好相反,解讀時需特別注意。如上表4,我們重點看“B值”和“OR值”。
比如,表格的第一行,研究的是“護士工作滿意度”的影響因素。雖然模型開始時納入了所有的自變量,但經(jīng)過篩選,最終有意義僅剩下“婚姻狀況”和“工作時間”(P<0.05)兩個有統(tǒng)計學意義的變量。這里我們以“婚姻狀況”為例來解讀OR值的含義。
根據(jù)自變量賦值表,婚姻狀況變量中“0”為“無配偶”,“1”為“有配偶”,其表格中對應的OR值為“4.045”(>1),根據(jù)我們上文總結的OR值的意義,大于1的OR值表明:暴露會促進結局的發(fā)生。
在本研究中,“暴露”可以理解為“有配偶”,“結局”可理解為“獲得高的工作滿意度”,因此,OR大于1,表明:隨著婚姻狀況的提升(從無配偶,“晉級”為有配偶),工作高滿意度的情況更容易發(fā)生。
從而說明,“婚姻狀況”是護士工作滿意度的一個影響因素,并且相對于“無配偶”的護士,“有配偶”的護士工作滿意度得分更高。
再次提醒,能夠這樣解讀,是因為我們把“工作滿意度高”賦值為“1”,“工作滿意度低”賦值為“0”,這個順序和“有無配偶”的順序是一致的。
與此形成對比,對于“醫(yī)生離職意愿”這個因變量而言,年齡的回歸系數(shù)(B值)為-0.711,其對應的OR值變?yōu)椤?.491”(<1),意味著,隨著年齡的提升,醫(yī)生的離職意愿是變低的。
這一點也是很符合常識的。一般而言,年齡越大,其在職年限也越大,各方面的待遇會更好些,所以更不會選擇離職。
最后,值得指出的是,本案例我們講解的Logistic回歸具體而言稱作“二分類”Logistic回歸分析,這也是應用最廣泛的一類。
而當因變量不再是二分類變量,而是多分類變量時,我們仍可以進行Logistic回歸,此時稱作“多分類Logistic回歸分析”。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03