
作者:丁點(diǎn)helper
來源:丁點(diǎn)幫你
前文,我們對(duì)Logistic回歸分析的來龍去脈有了一個(gè)基本的了解,但是Logistic回歸之所以應(yīng)用十分廣泛還有一個(gè)重要的原因——能直接輸出OR值?
什么是OR值?如何理解?我們今天就來好好看一看。
怎么理解OR值
多重線性回歸,一般是指有多個(gè)自變量X,只有一個(gè)因變量Y。前面我們主要是以簡(jiǎn)單線性回歸為例在介紹,兩者的差距主要在于自變量X的數(shù)量,在只有一個(gè)X時(shí),就稱簡(jiǎn)單線性回歸。
OR值是《流行病學(xué)》中的重要概念,稱作“優(yōu)勢(shì)比”(odds ratio),也稱“比值比”,反映的是某種暴露與結(jié)局的關(guān)聯(lián)強(qiáng)度。
這句話初學(xué)者看起來可能會(huì)特別費(fèi)勁:什么叫優(yōu)勢(shì)??jī)?yōu)勢(shì)比又是什么意思?暴露和結(jié)局又該怎么理解?我們結(jié)合例子把這些問題一一理清。
案例:我們想探討吸煙是否會(huì)導(dǎo)致糖尿病的發(fā)生。一種很實(shí)用的思路是找兩組人群,一組患有糖尿病,另一種不患糖尿病,然后,分別調(diào)查這兩組人群哪些人吸煙、哪些人不吸。
通過調(diào)查我們獲得如下數(shù)據(jù):
結(jié)合上表,可以看到,患病組一共有40人,其中24人吸煙,16人不吸煙。我們就稱“吸煙”是一種“暴露”。
所以,“暴露”具有十分廣泛的定義,一般某些研究對(duì)象具有我們感興趣的因素,就稱這些研究對(duì)象為“暴露組”。
暴露包括各種特征(如性別、年齡、教育程度等),以及某種特定的行為(如飲酒、不愛運(yùn)動(dòng)等),或接觸某種有毒、有害物質(zhì)(如PM2.5等),而不具備這些因素的對(duì)象稱為“非暴露組”。
所謂研究“暴露對(duì)結(jié)局”的影響,這里的“結(jié)局”在本例中就指“是否患有糖尿病”,一般可以等同于我們前面說的“因變量Y”。
所謂的“優(yōu)勢(shì)”可以理解為“暴露比值”!那怎么理解暴露比值呢?
在本例中,對(duì)于患有糖尿病的對(duì)象,暴露比值為:吸煙的比例除以不吸煙的比例,即為:24/16 = 1.50;同樣,在不患有糖尿病的人群中,也可以計(jì)算一個(gè)吸煙的比例除以不吸煙的比例,即為:18/22 = 0.82。
把這兩個(gè)比例相除,就得到了吸煙與糖尿病相關(guān)關(guān)系的OR值,即OR = 1.50/0.82 = 1.83>1。由此,我們可以初步推斷,吸煙會(huì)加重患糖尿病的風(fēng)險(xiǎn)。
一般而言,OR值的意義可以總結(jié)如下(假設(shè)結(jié)局發(fā)生記為1,不發(fā)生記為0):
OR = 1,暴露與結(jié)局的無相關(guān)性;
OR > 1,暴露可以促進(jìn)結(jié)局的發(fā)生;
OR < 1,暴露可以抑制結(jié)局事件的發(fā)生
Logistic很重要的意義就在于會(huì)直接輸出OR值,這一點(diǎn)甚至比看直接的回歸系數(shù)(β)還有意義。
OR值與回歸系數(shù)β的數(shù)量關(guān)系為:OR = eβ。在實(shí)際的應(yīng)用中應(yīng)該如何解讀OR值,我們結(jié)合一下文獻(xiàn)案例進(jìn)行講解。
R值的應(yīng)用分析
多重線性回歸,一般是指有多個(gè)自變量X,只有一個(gè)因變量Y。前面我們主要是以簡(jiǎn)單線性回歸為例在介紹,兩者的差距主要在于自變量X的數(shù)量,在只有一個(gè)X時(shí),就稱簡(jiǎn)單線性回歸。
以下文章于2015年發(fā)表于《中國護(hù)理管理》,研究團(tuán)隊(duì)主要采用Logistic回歸分析醫(yī)護(hù)人員“工作感受”的影響因素,研究的摘要截圖如下:
文章采用第五次國家衛(wèi)生服務(wù)調(diào)查問卷中有關(guān)工作感受的調(diào)查表,測(cè)量醫(yī)護(hù)人員工作感受情況:包括工作認(rèn)知、工作滿意度、職業(yè)緊張和離職意愿4個(gè)維度。
該研究并沒有直接采用“工作感受”量表總得分進(jìn)行研究,而是將上述4個(gè)維度分別作為“因變量(Y)”與其他因素,如性別、年齡、婚姻狀況、最高學(xué)歷、專業(yè)技術(shù)職稱(X)等進(jìn)行Logistic回歸分析。
前文我們強(qiáng)調(diào)了進(jìn)行Logistic回歸的基本條件是:Y是分類變量,本研究符合這個(gè)條件嗎?
符合。作者將“工作認(rèn)知、工作滿意度、職業(yè)緊張和離職意愿”的量表得分換算成兩個(gè)類別:1=高,0=低,由此,這些因變量就是典型的二分類變量,從而可以進(jìn)行Logistic回歸分析。
需要明確的是,該研究一共進(jìn)行了四次分析,因?yàn)橛兴膫€(gè)因變量。自變量賦值表和Logistic分析表如下:
我們?cè)诜治鯨ogistic回歸分析結(jié)果時(shí),必須結(jié)合自變量的賦值情況來看,這是因?yàn)閷ⅰ澳行浴辟x值為“1”得到的結(jié)果與將“男性”賦值為“0”的結(jié)果會(huì)正好相反,解讀時(shí)需特別注意。如上表4,我們重點(diǎn)看“B值”和“OR值”。
比如,表格的第一行,研究的是“護(hù)士工作滿意度”的影響因素。雖然模型開始時(shí)納入了所有的自變量,但經(jīng)過篩選,最終有意義僅剩下“婚姻狀況”和“工作時(shí)間”(P<0.05)兩個(gè)有統(tǒng)計(jì)學(xué)意義的變量。這里我們以“婚姻狀況”為例來解讀OR值的含義。
根據(jù)自變量賦值表,婚姻狀況變量中“0”為“無配偶”,“1”為“有配偶”,其表格中對(duì)應(yīng)的OR值為“4.045”(>1),根據(jù)我們上文總結(jié)的OR值的意義,大于1的OR值表明:暴露會(huì)促進(jìn)結(jié)局的發(fā)生。
在本研究中,“暴露”可以理解為“有配偶”,“結(jié)局”可理解為“獲得高的工作滿意度”,因此,OR大于1,表明:隨著婚姻狀況的提升(從無配偶,“晉級(jí)”為有配偶),工作高滿意度的情況更容易發(fā)生。
從而說明,“婚姻狀況”是護(hù)士工作滿意度的一個(gè)影響因素,并且相對(duì)于“無配偶”的護(hù)士,“有配偶”的護(hù)士工作滿意度得分更高。
再次提醒,能夠這樣解讀,是因?yàn)槲覀儼?strong>“工作滿意度高”賦值為“1”,“工作滿意度低”賦值為“0”,這個(gè)順序和“有無配偶”的順序是一致的。
與此形成對(duì)比,對(duì)于“醫(yī)生離職意愿”這個(gè)因變量而言,年齡的回歸系數(shù)(B值)為-0.711,其對(duì)應(yīng)的OR值變?yōu)椤?.491”(<1),意味著,隨著年齡的提升,醫(yī)生的離職意愿是變低的。
這一點(diǎn)也是很符合常識(shí)的。一般而言,年齡越大,其在職年限也越大,各方面的待遇會(huì)更好些,所以更不會(huì)選擇離職。
最后,值得指出的是,本案例我們講解的Logistic回歸具體而言稱作“二分類”Logistic回歸分析,這也是應(yīng)用最廣泛的一類。
而當(dāng)因變量不再是二分類變量,而是多分類變量時(shí),我們?nèi)钥梢赃M(jìn)行Logistic回歸,此時(shí)稱作“多分類Logistic回歸分析”。
關(guān)于多分類的Logistic回歸分析操作起來較為復(fù)雜,后期我們有機(jī)會(huì)再進(jìn)行更詳細(xì)的講解。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03