2021-04-22
閱讀量:
796
機(jī)器學(xué)習(xí) 測試集正確率越高就代表這個模型越好嗎?
這種觀點是不對的,并不是說在測試機(jī)上精度越高的模型就一定越好,尤其是這種正負(fù)樣本差距可能會很大的問題。
比如你這個癌癥的發(fā)病率在樣本里總共才10%,那么一個一直判斷為沒有癌癥的模型就能夠獲得90%的精度,但顯然這種模型沒有任何的作用。
現(xiàn)實里對這種問題,你可以先解決數(shù)據(jù)不均衡的問題,像是修改loss的計算或者重復(fù)采樣之類的最后評判模型的好壞的時候,不要去看模型的正確率,而是去看看每種模型的查準(zhǔn)率、回收率或者AUC(Area under Curve):Roc曲線下的面積






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論
0條評論