
理論物理學家和研究科學家Mehmet Suzen曾表示,二分類任務是機器學習的基礎。但是,其性能的標準統(tǒng)計信息是一種數(shù)學工具,ROC-AUC很難解釋。在這里,引入了一種性能度量,該度量僅考慮進行正確的二進制分類的可能性。
機器學習模型的核心應用是二分類任務。從用于診斷測試的醫(yī)學領域到為消費者提供信用風險決策的領域,有很多領域。建立分類器的技術多種多樣,從簡單的決策樹到邏輯回歸,再到最近利用多層神經網(wǎng)絡的超酷深度學習模型。但是,它們在構造和訓練方法上在數(shù)學上有所不同,就其評估而言,事情變得棘手。在本文中,我們?yōu)閷嵺`中的二元分類器提出了一種簡單且可解釋的性能指標。
為什么ROC-AUC無法解釋?
因為不同的閾值會產生不同的混淆矩陣。
報告分類器性能的實際標準是使用接收機工作特性(ROC)-曲線下面積(AUC)''度量。它起源于1940年代美國海軍研發(fā)雷達時,用于測量探測性能。 ROC-AUC的含義至少有5種不同的定義,即使您擁有博士學位也是如此。在機器學習中,人們很難解釋AUC作為績效指標的含義。由于AUC功能幾乎在所有圖書館中都可用,并且它幾乎像一種宗教儀式一樣,在機器學習論文中作為分類表現(xiàn)進行報告。但是,除了荒謬的比較問題之外,其解釋并不容易,請參閱hmeasure。 AUC會根據(jù)從不同閾值的混淆矩陣中提取的假正率(FPR)來衡量真正率(TPR)曲線下的面積。
f(x)= y
∫10 f(x)dx = AUC
其中,y是TPR,x是FPR。除了多種解釋且容易混淆之外,將積分放在FPR之上沒有明確的目的。顯然,我們希望通過將FPR設置為零來實現(xiàn)完美的分類,但是該區(qū)域在數(shù)學上并不清晰,這意味著它作為一個數(shù)學對象是不清楚的。
正確分類的概率(PCC)
對于二分類問題的分類器而言,一種簡單且可解釋的性能指標對于技術含量高的數(shù)據(jù)科學家和非技術利益相關者都非常有用。這個方向的基本租戶是,分類器技術的目的是區(qū)分兩個類別的能力。這歸結為一個概率值,正確分類的概率(PCC)。一個明顯的選擇是所謂的平衡精度(BA)。通常建議將其用于不平衡問題,即使是SAS也是如此;盡管他們使用了概率相乘。由于統(tǒng)計上的依賴性,在這里我們將BA稱為PCC并使用加法代替:
PCC =(TPR + TNR)/ 2
TPR = TP /(條件正例)= TP /(TP + FN)
TNR = TN /(條件負例)= TN /(TN + FP)。
PCC告訴我們分類器在檢測任何一個分類中有多好,它是一個概率值[0,1]。請注意,即使我們的數(shù)據(jù)在生產中是均衡的,在肯定和否定情況下使用總精度也會產生誤導,即使我們衡量績效的批次可能不均衡,所以僅憑準確性并不是一個好方法。
生產問題
迫在眉睫的問題是如何在生成混淆矩陣時選擇閾值?一種選擇是選擇一個閾值,以使PCC在測試集上的生產最大化。為了改善PCC的估計,可以對測試集進行重采樣以獲得良好的不確定性。
結論
我們嘗試通過引入PCC或平衡精度作為二進制分類器的一種簡單且可解釋的性能指標來規(guī)避報告AUC。這很容易向非技術人員解釋。可以引入一種改進的PCC,它考慮到更好的估計屬性,但是主要解釋仍然與正確分類的可能性相同。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03