99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話：13121318867

登錄

首頁大數(shù)據(jù)時代CDA LEVEL 1 考試，知識點匯總《分類分析》

CDA LEVEL 1 考試，知識點匯總《分類分析》

2024-08-13

一、相關(guān)性檢驗

列聯(lián)表和卡方檢驗分類變量之間的相關(guān)性一般可以采用列聯(lián)表分析或卡方檢驗的方法來進(jìn)行驗證。列聯(lián)表是兩個分類變量的分類水平之間形成的交叉頻數(shù)表，通過計算行百分比或列百分比，對實際頻率和期望頻率進(jìn)行對比分析，例如一個典型的列聯(lián)表如下：

對于表中頻數(shù)、期望頻數(shù)、行/列百分比的解讀方法要熟練掌握。比如98代表的是頭發(fā)顏色為金色，眼睛顏色為深色的樣本數(shù)量。而355.2則是期望的數(shù)量。6.7%是行百分比，也就是在所有頭發(fā)顏色為金色的樣本中，眼睛顏色為深色的占比。

列聯(lián)表是一種比較簡單的描述性統(tǒng)計方法，而卡方檢驗則可以通過量化的方法對兩個分類變量的相關(guān)性進(jìn)行檢驗，卡方統(tǒng) 計量如下：

二、邏輯回歸

在掌握了列聯(lián)表分析和卡方檢驗的基礎(chǔ)上，可以學(xué)習(xí)使用邏輯回歸對分類變量進(jìn)行預(yù)測。邏輯回歸主要處理的就是分類問題。事實上，也可以把他看作是線性回歸一種延伸。我們面對的因變量，也就是模型輸出結(jié)果不再是一個連續(xù)變量，而是一個分類變量。最常見的邏輯回歸就是二分類變量邏輯回歸，通常我們可以使用這種方法來尋找目標(biāo)客戶。

三、邏輯回歸，變量篩選

1.進(jìn)行邏輯回歸時，我們希望選擇的變量盡可能地有效，避免冗余。常用的變量篩選方法有如下幾種：

Wald檢驗：通過Wald統(tǒng)計量，來檢驗自變量對因變量的影響能力。Wald越大，說明自變量的相關(guān)性越大，越應(yīng)該保留。

似然比檢驗(Likehood Ratio)：也是邏輯回歸非常常用的一種檢驗方法。邏輯回歸模型的估計一般是使用最大似然估計，也就是說找到一個似然函數(shù)L，使其達(dá)到最大值。L越大，也就說明模型的預(yù)測效果越好。因此似然比檢驗本質(zhì)上是對包含或者不包含某一個或者幾個變量的模型L值進(jìn)行比較，從而做出判斷。

比分檢驗(Score Test)：以包含某個或者某幾個變量的模型作為基礎(chǔ)，加入系數(shù)為0的新變量，通過計算似然函數(shù)的一階偏導(dǎo)數(shù)和信息矩陣，取兩者的乘積作為最終的統(tǒng)計量。

這三種方法中，似然比檢驗是最可靠，也是最常用的一種變量篩選方法。在變量存在共線性時，Wald檢驗結(jié)果不可靠。另外，實際應(yīng)用是以上三種方法，都可以采用向前或者向后逐步的方式進(jìn)行變量篩選。

另外在邏輯回歸模型里，我們需要使得自變量和因變量的對數(shù)存在線性關(guān)系。如果發(fā)現(xiàn)實際的變量不符合，可以通過篩選變量，變量轉(zhuǎn)換等方式進(jìn)行調(diào)整。另外變量轉(zhuǎn)換也可以避免異常值對結(jié)果造成偏差。

前面提到，邏輯回歸的模型參數(shù)估計通常采用的是最大似然函數(shù)法，因此理論上需要有一定量的樣本才能采用這種方法，否則檢驗公式就是不合理的。另外也需要注意的是，邏輯回歸的模型無法解決多重共線性的問題，因此在輸入變量前，對變量進(jìn)行檢驗和清洗是非常必要的。得到模型后，我們可以通過混淆矩陣和ROC曲線來評判模型的效果。

2.混淆矩陣——靈敏度和特異度

靈敏度指的是模型“擊中”的概率，也就是對于實際發(fā)生（取值為1）的樣本，模型預(yù)測為1的概率。對應(yīng)上圖的公式為 A/(A+B)。

特異度指的是模型“正確否定”的概率，也就是說對于實際沒發(fā)生（取值為0）的樣本，模型預(yù)測為0的概率。對應(yīng)上圖的公式為D/(C+D)。

因此，可以看到不管是靈敏度還是特異度，都是越高，說明我們的模型越有效。在實際應(yīng)用中，由于邏輯回歸模型計算的結(jié)果其實是一個相對可能性p，因此我們可以根據(jù)實際情況調(diào)整判斷取值為1的p的標(biāo)準(zhǔn)。更有側(cè)重性地提高靈敏度或者特異度。

3.ROC曲線

除了使用混淆矩陣，我們還可以通過ROC曲線的方式來圖形化地判斷模型效果。

ROC曲線也是基于靈敏度和特異度來進(jìn)行判斷的。曲線下面積AUC 指的是ROC曲線、底線和右側(cè)線圍成的面積。ROC曲線的面積一般在0.5-1之間。這個數(shù)值越接近1，表明模型預(yù)測能力越強。當(dāng)AUC 在0.7-0.9時，我們認(rèn)為模型有較高的判斷作用。而AUC接近0.5的時候，我們?nèi)藶檫@個模型是無效的。

在實際業(yè)務(wù)中，我們一般利用二分類邏輯回歸作為篩選目標(biāo)客戶的主要手段。不管是識別明星客戶、流失客戶，甚至是可能存在違約或者欺詐行為的客戶，都可以采用這種方法。

四、例題精講

1. 某客戶為欺詐的概率為0.4，則優(yōu)勢odds為（）？

A. 0.4

B .2 / 3

C. 3 / 2

D. 0.6

答案：B 解析：該題考核了二分類變量分析的基礎(chǔ)知識。Odds的定義是顯性結(jié)果的概率比上非顯性結(jié)果的概率，因此為0.4 / 0.6，等于2 / 3。

2. 建立邏輯回歸時，為什么有時候需要對連續(xù)變量進(jìn)行分箱處理?

A. 避免變量的共線性

B. 捕獲原始連續(xù)變量和被解釋變量之間非線性關(guān)系

C. 避免異常值影響

D. 修正殘差非正態(tài)分布

答案：BC 解析：如果發(fā)現(xiàn)解釋變量與反應(yīng)變量之間相關(guān)，但又不呈現(xiàn)線性關(guān)系時，往往會對解釋變量進(jìn)行分箱，同時分箱也能夠消除極端值。因此選BC。

點擊CDA題庫鏈接，獲取免費版CDA題庫入口，?？荚図樌?，快速拿證！

CDA數(shù)據(jù)分析師考試相關(guān)入口一覽（建議收藏）：

? 想報名CDA認(rèn)證考試，點擊>>> “CDA報名” 了解CDA考試詳情；

? 想學(xué)習(xí)CDA考試教材，點擊>>> “CDA教材” 了解CDA考試詳情；

? 想加入CDA考試題庫，點擊>>> “CDA題庫” 了解CDA考試詳情；

? 想了解CDA考試含金量，點擊>>> “CDA含金量” 了解CDA考試詳情；

邏輯回歸 ROC曲線特異度 AUC 混淆矩陣二分類列聯(lián)表分析異常值

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼，搜微信號：CDAshujufenxi

上一篇什么是業(yè)務(wù)分析模型，如何搭建業(yè)務(wù)模型？

下一篇大廠急需，人才空缺2000萬，這個職業(yè)今年又火了！

CDA報考指南

報考流程
考試時間
報名費用
聯(lián)系我們

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

京公網(wǎng)安備 11010802034615號經(jīng)營許可證編號：京B2-20210330

聯(lián)系電話：13321103290 (微信同號)

CDA教材
CDA題庫
CDA大綱

客服在線

立即咨詢

客服在線

立即咨詢

免密碼登錄

提交首次登錄驗證后自動注冊

') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1：配置參數(shù) // 參數(shù)2：回調(diào)，回調(diào)的第一個參數(shù)驗證碼對象，之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須，不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式，包括：float，popup width: "280px", https: true // 更多配置參數(shù)說明請參見：http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'！'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'！'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

CDA LEVEL 1 考試，知識點匯總《分類分析》

一、相關(guān)性檢驗

二、邏輯回歸

三、邏輯回歸，變量篩選

四、例題精講

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】LSTM 模型輸入長度選擇技巧：提升序列建 ...

CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南 ...

【CDA干貨】數(shù)據(jù)透視表中兩列相乘合計的實用指南 ...

CDA 認(rèn)證考試大綱 2025 重磅更新：一二級考綱變化匯 ...

BI 大數(shù)據(jù)分析師：連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者 ...

SQL 在預(yù)測分析中的應(yīng)用：從數(shù)據(jù)查詢到趨勢預(yù)判 ...

數(shù)據(jù)查詢結(jié)束后：分析師的收尾工作與價值深化 ...

CDA 數(shù)據(jù)分析師考試：從報考到取證的全攻略 ...

【CDA干貨】單樣本趨勢性檢驗：捕捉數(shù)據(jù)背后的時間 ...

year_month數(shù)據(jù)類型：時間維度的精準(zhǔn)切片 ...

CDA 備考干貨：Python 在數(shù)據(jù)分析中的核心應(yīng)用與實 ...

【CDA干貨】SPSS 中的 Mann-Kendall 檢驗：數(shù)據(jù)趨勢 ...

備戰(zhàn) CDA 數(shù)據(jù)分析師考試：需要多久？如何規(guī)劃？ ...

【CDA干貨】LSTM 輸出不確定的成因、影響與應(yīng)對策略 ...

統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用 ...

CDA數(shù)據(jù)分析師證書考試全攻略

剖析 CDA 數(shù)據(jù)分析師考試題型：解鎖高效備考與答題 ...

【CDA干貨】SQL Server 字符串截取轉(zhuǎn)日期：解鎖數(shù)據(jù) ...

CDA 數(shù)據(jù)分析師視角：從數(shù)據(jù)迷霧中探尋商業(yè)真相 ...

CDA 數(shù)據(jù)分析師：開啟數(shù)據(jù)職業(yè)發(fā)展新征程 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

CDA LEVEL 1 考試，知識點匯總《分類分析》

一、相關(guān)性檢驗

二、邏輯回歸

三、邏輯回歸，變量篩選

四、例題精講

數(shù)據(jù)分析師考試動態(tài)

CDA報考指南

數(shù)據(jù)分析學(xué)習(xí)

數(shù)據(jù)分析師資訊

【CDA干貨】LSTM 模型輸入長度選擇技巧：提升序列建 ...

CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南 ...

【CDA干貨】數(shù)據(jù)透視表中兩列相乘合計的實用指南 ...

CDA 認(rèn)證考試大綱 2025 重磅更新：一二級考綱變化匯 ...

BI 大數(shù)據(jù)分析師：連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者 ...

SQL 在預(yù)測分析中的應(yīng)用：從數(shù)據(jù)查詢到趨勢預(yù)判 ...

數(shù)據(jù)查詢結(jié)束后：分析師的收尾工作與價值深化 ...

CDA 數(shù)據(jù)分析師考試：從報考到取證的全攻略 ...

【CDA干貨】單樣本趨勢性檢驗：捕捉數(shù)據(jù)背后的時間 ...

year_month數(shù)據(jù)類型：時間維度的精準(zhǔn)切片 ...

CDA 備考干貨：Python 在數(shù)據(jù)分析中的核心應(yīng)用與實 ...

【CDA干貨】SPSS 中的 Mann-Kendall 檢驗：數(shù)據(jù)趨勢 ...

備戰(zhàn) CDA 數(shù)據(jù)分析師考試：需要多久？如何規(guī)劃？ ...

【CDA干貨】LSTM 輸出不確定的成因、影響與應(yīng)對策略 ...

統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用 ...

CDA數(shù)據(jù)分析師證書考試全攻略

剖析 CDA 數(shù)據(jù)分析師考試題型：解鎖高效備考與答題 ...

【CDA干貨】SQL Server 字符串截取轉(zhuǎn)日期：解鎖數(shù)據(jù) ...

CDA 數(shù)據(jù)分析師視角：從數(shù)據(jù)迷霧中探尋商業(yè)真相 ...

CDA 數(shù)據(jù)分析師：開啟數(shù)據(jù)職業(yè)發(fā)展新征程 ...

CDA教育閉環(huán)

常見問題

關(guān)于我們

CDA數(shù)據(jù)分析師公眾號

CDA考試中心小程序

CDA數(shù)據(jù)分析師App下載

CDA LEVEL 1 考試，知識點匯總《分類分析》

三、邏輯回歸，變量篩選

四、例題精講

備戰(zhàn) CDA 數(shù)據(jù)分析師考試：需要多久？如何規(guī)劃？ ...

【CDA干貨】LSTM 輸出不確定的成因、影響與應(yīng)對策略 ...