
理論物理學(xué)家和研究科學(xué)家Mehmet Suzen曾表示,二分類任務(wù)是機(jī)器學(xué)習(xí)的基礎(chǔ)。但是,其性能的標(biāo)準(zhǔn)統(tǒng)計(jì)信息是一種數(shù)學(xué)工具,ROC-AUC很難解釋。在這里,引入了一種性能度量,該度量僅考慮進(jìn)行正確的二進(jìn)制分類的可能性。
機(jī)器學(xué)習(xí)模型的核心應(yīng)用是二分類任務(wù)。從用于診斷測試的醫(yī)學(xué)領(lǐng)域到為消費(fèi)者提供信用風(fēng)險(xiǎn)決策的領(lǐng)域,有很多領(lǐng)域。建立分類器的技術(shù)多種多樣,從簡單的決策樹到邏輯回歸,再到最近利用多層神經(jīng)網(wǎng)絡(luò)的超酷深度學(xué)習(xí)模型。但是,它們在構(gòu)造和訓(xùn)練方法上在數(shù)學(xué)上有所不同,就其評估而言,事情變得棘手。在本文中,我們?yōu)閷?shí)踐中的二元分類器提出了一種簡單且可解釋的性能指標(biāo)。
為什么ROC-AUC無法解釋?
因?yàn)椴煌拈撝禃a(chǎn)生不同的混淆矩陣。
報(bào)告分類器性能的實(shí)際標(biāo)準(zhǔn)是使用接收機(jī)工作特性(ROC)-曲線下面積(AUC)''度量。它起源于1940年代美國海軍研發(fā)雷達(dá)時(shí),用于測量探測性能。 ROC-AUC的含義至少有5種不同的定義,即使您擁有博士學(xué)位也是如此。在機(jī)器學(xué)習(xí)中,人們很難解釋AUC作為績效指標(biāo)的含義。由于AUC功能幾乎在所有圖書館中都可用,并且它幾乎像一種宗教儀式一樣,在機(jī)器學(xué)習(xí)論文中作為分類表現(xiàn)進(jìn)行報(bào)告。但是,除了荒謬的比較問題之外,其解釋并不容易,請參閱hmeasure。 AUC會根據(jù)從不同閾值的混淆矩陣中提取的假正率(FPR)來衡量真正率(TPR)曲線下的面積。
f(x)= y
∫10 f(x)dx = AUC
其中,y是TPR,x是FPR。除了多種解釋且容易混淆之外,將積分放在FPR之上沒有明確的目的。顯然,我們希望通過將FPR設(shè)置為零來實(shí)現(xiàn)完美的分類,但是該區(qū)域在數(shù)學(xué)上并不清晰,這意味著它作為一個(gè)數(shù)學(xué)對象是不清楚的。
正確分類的概率(PCC)
對于二分類問題的分類器而言,一種簡單且可解釋的性能指標(biāo)對于技術(shù)含量高的數(shù)據(jù)科學(xué)家和非技術(shù)利益相關(guān)者都非常有用。這個(gè)方向的基本租戶是,分類器技術(shù)的目的是區(qū)分兩個(gè)類別的能力。這歸結(jié)為一個(gè)概率值,正確分類的概率(PCC)。一個(gè)明顯的選擇是所謂的平衡精度(BA)。通常建議將其用于不平衡問題,即使是SAS也是如此;盡管他們使用了概率相乘。由于統(tǒng)計(jì)上的依賴性,在這里我們將BA稱為PCC并使用加法代替:
PCC =(TPR + TNR)/ 2
TPR = TP /(條件正例)= TP /(TP + FN)
TNR = TN /(條件負(fù)例)= TN /(TN + FP)。
PCC告訴我們分類器在檢測任何一個(gè)分類中有多好,它是一個(gè)概率值[0,1]。請注意,即使我們的數(shù)據(jù)在生產(chǎn)中是均衡的,在肯定和否定情況下使用總精度也會產(chǎn)生誤導(dǎo),即使我們衡量績效的批次可能不均衡,所以僅憑準(zhǔn)確性并不是一個(gè)好方法。
生產(chǎn)問題
迫在眉睫的問題是如何在生成混淆矩陣時(shí)選擇閾值?一種選擇是選擇一個(gè)閾值,以使PCC在測試集上的生產(chǎn)最大化。為了改善PCC的估計(jì),可以對測試集進(jìn)行重采樣以獲得良好的不確定性。
結(jié)論
我們嘗試通過引入PCC或平衡精度作為二進(jìn)制分類器的一種簡單且可解釋的性能指標(biāo)來規(guī)避報(bào)告AUC。這很容易向非技術(shù)人員解釋??梢砸胍环N改進(jìn)的PCC,它考慮到更好的估計(jì)屬性,但是主要解釋仍然與正確分類的可能性相同。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時(shí)代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03