2018-10-29
閱讀量:
1264
如何判斷機(jī)器學(xué)習(xí)算法哪個更好?
為了告訴機(jī)器學(xué)習(xí)算法(或研究人員)模型2優(yōu)于模型1,我們需要更好的指標(biāo),而不僅僅是計(jì)算錯誤的數(shù)量。
我們介紹了真陽性,真陰性,假陽性和假陰性的概念:
真陽性(TP rate) - 一個積極的例子,被 正確歸類為陽性
真陰性(TN rate) - 一個陰性的例子,被 正確分類為 陰性
誤報(bào)(FP rate) - 一個否定的例子, 但被錯誤地歸類為正面
假陰性(FN rate) - 一個積極但被錯誤歸類為消極的例子
基于此以上。我們還將得到以下真實(shí)陽性率,真實(shí)陰性率,假陽性率,假陰性率:
使用這些新指標(biāo),讓我們將其與計(jì)算上述示例所犯錯誤數(shù)量的傳統(tǒng)指標(biāo)進(jìn)行比較。首先,我們將使用舊指標(biāo)來計(jì)算出錯的次數(shù)(錯誤):
如上所示,模型1看起來比模型2(1.0%誤差)具有更低的誤差(0.1%誤差),但我們知道模型2是更好的,因?yàn)樗a(chǎn)生更少的假陰性(FN)(最大化真陽性( TP))?,F(xiàn)在讓我們看看模型1和模型2的性能與新指標(biāo)的相似之處:
現(xiàn)在,我們可以看到模型1的假陰性率為70%,而模型2的假陰性率僅為20%,這顯然是更好的分類器。這就是我們應(yīng)該教育機(jī)器學(xué)習(xí)算法(或我們)使用它以便允許它選擇更好的算法。






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論
0條評論