
SPSS—二元Logistic回歸結(jié)果分析
1: 在“案例處理匯總”中可以看出:選定的案例 489 個,未選定的案例 361 個,這個結(jié)果是根據(jù)設(shè)定的 validate = 1
得到的,在“因變量編碼”中可以看 出“違約”的兩種結(jié)果“是”或者“否” 分別用值“1“和“0”代替, 在“分 類變量編碼”中教育水平分為 5
類, 如果選中“為完成高中,高中,大專,大 學(xué)等,其中的任何一個,那么就取值為 1,未選中的為 0,如果四個都未被選中, 那么就是”研究生“
頻率分別代表了處在某個教育水平的個數(shù),總和應(yīng)該為 489 個
1:在“分類表”中可以看出: 預(yù)測有 360 個是“否”(未違約)
有 129 個是 “是”(違約) 2:在“方程中的變量”表中可以看出:最初是對“常數(shù)項”記性賦值,B 為 -1.026,
標(biāo)準(zhǔn)誤差為:0.103 那么 wald =( B/S.E)?=(-1.026/0.103)? = 99.2248, 跟表中的“100.029
幾乎 接近,是因為我對數(shù)據(jù)進行的向下舍入的關(guān)系,所以數(shù)據(jù)會稍微偏小, B 和 Exp(B) 是對數(shù)關(guān)系,將 B
進行對數(shù)抓換后,可以得到:Exp(B) = e^-1.026 = 0.358, 其中自由度為 1, sig 為 0.000,非常顯著
1:從“不在方程中的變量”可以看出,最初模型,只有“常數(shù)項”被納入了模 型,其它變量都不在最初模型內(nèi) 表中分別給出了,得分,df , Sig 三個值, 而其中得分(Score)計算公式如下:
(公式中 (Xi- X?) 少了一個平方)
下面來舉例說明這個計算過程:(“年齡”自變量的得分為例)
從“分類表”中可以看出:有 129 人違約,違約記為“1” 129, 選定案例總和為 489 那么: y? = 129/489 =
0.2638036809816 x? = 16951 / 489 = 34.664621676892 所以:∑(Xi-x?)? =
30074.9979 y?(1-y?)=0.2638036809816 *(1-0.2638036809816 ) 則 違約總和為
=0.19421129888216 則:y?(1-y?)* 840.9044060372 ∑(Xi-x?)? =0.19421129888216 * 30074.9979 = 5
則:[∑Xi(yi - y?)]^2 = 43570.8 所以:
=43570.8 / 5 840.9044060372 = 7.4595982010876 = 7.46 (四舍五入)
計算過程采用的是在 EXCEL 里面計算出來的,截圖如下所示:
從“不在方程的變量中”可以看出,年齡的“得分”為 7.46,剛好跟計算結(jié)果 吻合??!答案得到驗證~!?。?!
1:從“塊
1” 中可以看出:采用的是:向前步進 的方法, 在“模型系數(shù)的綜 合檢驗”表中可以看出: 所有的 SIG 幾乎都為“0” 而且隨著模型的逐漸步
進,卡方值越來越大,說明模型越來越顯著,在第 4 步后,終止, 根據(jù)設(shè)定的顯著性值 和 自由度,可以算出 卡方臨界值, 公式為:
=CHIINV(顯著性值,自由度) ,放入 excel 就可以得到結(jié)果 2:在“模型匯總“中可以看出:Cox&SnellR 方 和
Nagelkerke R 方 擬合效果 都不太理想,最終理想模型也才:0.305 和 0.446, 最大似然平方的對數(shù)值 都比較大,明顯是顯著的
似然數(shù)對數(shù)計算公式為:
計算過程太費時間了,我就不舉例說明
計算過程了 Cox&SnellR 方的計算值 是根據(jù): 1:先擬合不包含待檢驗因素的 Logistic 模型,求對數(shù)似然函數(shù)值
INL0 (指只包含“常數(shù)項”的檢驗) 2:再擬合包含待檢驗因素的 Logistic 模型,求新的對數(shù)似然函數(shù)值 InLB (包含自變量的檢驗)
再根據(jù)公式: 值!
即可算出:Cox&SnellR 方的
提示:
將 Hosmer 和 Lemeshow 檢驗 和“隨機性表” 結(jié)合一起來分析 1:從 Hosmer 和 Lemeshow
檢驗表中,可以看出:經(jīng)過 4 次迭代后,最終的卡 方統(tǒng)計量為:11.919, 而臨界值為:CHINV(0.05,8) = 15.507
卡方統(tǒng)計量< 臨界值,從 SIG 角度來看: 0.155 > 0.05 , 說明模型能夠很好 的擬合整體,不存在顯著的差異。 2:從
Hosmer 和 Lemeshow 檢驗隨即表中可以看出: ”觀測值“和”期望值 “幾乎是接近的, 不存在很大差異,
說明模型擬合效果比較理想, 印證了“Hosmer 和 Lemeshow 檢驗”中的結(jié)果 而“Hosmer 和 Lemeshow
檢驗”表中的“卡方”統(tǒng)計量,是通過“Hosmer 和 Lemeshow 檢驗隨即表”中的數(shù)據(jù)得到的(即通過“觀測值和”預(yù)測值“)得到
的,計算公式如下所示:
x?(卡方統(tǒng)計量) =
∑(觀測值頻率- 預(yù)測值頻率)^2 / 預(yù)測值的頻率
舉例說明一下計算過程:以計算 "步驟 1 的卡方統(tǒng)計量為例 " 1:將“Hosmer 和 Lemeshow 檢驗隨即表”中“步驟 1 ” excel 中,得到如下所示結(jié)果: 的數(shù)據(jù),復(fù)制到
從“Hosmer 和 Lemeshow 檢驗”表中可以看出, 步驟 1 的卡方統(tǒng)計量為: 7.567, 在上圖中,通過 excel 計算得到,結(jié)果為 7.566569 ~~7.567 (四舍 五入),結(jié)果是一致的,答案得到驗證?。?br />
1:
從“分類表”—“步驟 1” 中可以看出: 選定的案例中, “是否曾今違約” 總計:489 個,其中 沒有違約的 360 個,并且對 360
個“沒有違約”的客戶進 行了預(yù)測, 340 個預(yù)測成功, 個預(yù)測失敗, 有 20 預(yù)測成功率為: / 360 =94.4% 340
其中“違約”的有 189 個,也對 189 個“違約”的客戶進行了預(yù)測,有 95 個 預(yù)測失敗, 34 個預(yù)測成功,預(yù)測成功率:34 / 129
= 26.4% 總計預(yù)測成功率:(340 + 34)/ 489 = 76.5% 步驟 1 的 總體預(yù)測成功率為: 76.5%, 在步驟 4
終止后, 總體預(yù)測成功率為: 83.4, 預(yù)測準(zhǔn)確率逐漸提升 76.5%—79.8%—81.4%—83.4。 83.4 的預(yù)測準(zhǔn)確率,
不能夠算太高,只能夠說還行。
從“如果移去項則建?!北碇锌梢钥闯觯骸霸?2 對數(shù)似然中的更改” 中的數(shù)值 是不是很眼熟???,跟在“模型系數(shù)總和檢驗”表中“卡方統(tǒng)計量"量的值是 一樣的?。。?br />
將“如果移去項則建?!焙?
“方程中的變量”兩個表結(jié)合一起來看 1: 在“方程中的變量”表中可以看出: 在步驟 1 中輸入的變量為“負債率” ,
在”如果移去項則建模“表中可以看出,當(dāng)移去“負債率”這個變量時,引起了 74.052 的數(shù)值更改,此時模型中只剩下“常數(shù)項”-282.152
為常數(shù)項的對數(shù)似 然值 在步驟 2 中,當(dāng)移去“工齡”這個自變量時,引起了 44.543 的數(shù)值變化(簡 稱:似然比統(tǒng)計量),在步驟 2
中,移去“工齡”這個自變量后,還剩下“負債 率”和“常量”,此時對數(shù)似然值 變成了:-245.126,此時我們可以通過公式
算出“負債率”的似然比統(tǒng)計量:計算過程如下: 似然比統(tǒng)計量 = 2(-245.126+282.152)=74.052 答案得到驗證?。?!
2:在“如果移去項則建?!北碇锌梢钥闯觯翰还芤迫ツ且粋€自變量,“更改的 顯著性”都非常小,幾乎都小于 0.05,所以這些自變量系數(shù)跟模型顯著相關(guān), 不能夠剔去??! 3:根據(jù)" 方程中的變量“這個表,我們可以得出 logistic 回歸模型表達式:
= =
1 / 1+ e^-(a+∑βI*Xi)
我們假設(shè) Z
么可以得到簡潔表達式:
P(Y)
= 1 / 1+e^ (-z) 將”方程中的變量“ —步驟 4 中的參數(shù)代入 模型表達式中,可以得 到 logistic 回歸 模型
如下所示: P(Y) = 1 / 1 + e ^ -(-0.766+0.594*信用卡負債率+0.081*負債率-0.069*地
址-0.249*功齡)
從”不在方程中的變量“表中可以看出: 年齡,教育,收入,其它負債,都沒 有納入模型中,其中:sig 值都大于 0.05,所以說明這些自變量跟模型顯著不 相關(guān)。
在”觀察到的組和預(yù)測概率圖”中可以看出:
1:the Cut Value is 0.5, 此處以 0.5 為切割值,預(yù)測概率大于 0.5,表示 客戶“違約”的概率比較大,小于 0.5
表示客戶“違約”概率比較小。 2: 從上圖中可以看出:預(yù)測分布的數(shù)值基本分布在“左右兩端”在大于 0.5 的切割值中,大部分都是“1”
表示大部分都是“違約”客戶,( 大約 230 個 違約客戶) 預(yù)測概率比較準(zhǔn),而在小于 0.5 的切割值中,大部分都是“0” 大
部分都是“未違約”的客戶,(大約 500 多個客戶,未違約) 預(yù)測也很準(zhǔn)
在運行結(jié)束后,會自動生成多個自變量,如下所示:
1:從上圖中可以看出,已經(jīng)對客戶“是否違約”做出了預(yù)測,上面用顏色標(biāo)記
的部分-PRE_1 表示預(yù)測概率, 上面的預(yù)測概率,可以通過 前面的 Logistic 回歸模型計算出來,計算過程不 演示了 2:
COOK_1 和 SRE_1 的值可以跟 預(yù)測概率 (PRE_1) 進行畫圖, 來看 COOK_1 和 SRE_1 對預(yù)測概率的影響程度,因為
COOK 值跟模型擬合度有一定的關(guān)聯(lián),發(fā)生 奇異值,會影響分析結(jié)果。如果有太多奇異值,應(yīng)該單獨進行深入研究!
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03