重要參數(shù):
criterion
回歸樹(shù)衡量分枝質(zhì)量的指標(biāo),支持的標(biāo)準(zhǔn)有三種:
1 )輸入 "mse" 使用均方誤差 mean squared error(MSE) ,父節(jié)點(diǎn)和葉子節(jié)點(diǎn)之間的均方誤差的差額將被用來(lái)作為特征選擇的標(biāo)準(zhǔn),這種方法通過(guò)使用葉子節(jié)點(diǎn)的均值來(lái)最小化L2 損失
2 )輸入 “friedman_mse” 使用費(fèi)爾德曼均方誤差,這種指標(biāo)使用弗里德曼針對(duì)潛在分枝中的問(wèn)題改進(jìn)后的均方誤差
3 )輸入 "mae" 使用絕對(duì)平均誤差 MAE ( mean absolute error ),這種指標(biāo)使用葉節(jié)點(diǎn)的中值來(lái)最小化 L1 損失
屬性:
最重要的是 feature_importances_
接口:
apply, fifit, predict, score 最核心。
注:
幾乎所有參數(shù),屬性及接口都和分類樹(shù)一模一樣。需要注意的是,在回歸樹(shù)中,沒(méi)有標(biāo)簽分布是否均衡的問(wèn)題,因此沒(méi)有class_weight 這樣的參數(shù)。
在回歸樹(shù)中,MSE不只是我們的分枝質(zhì)量衡量指標(biāo),也是我們最常用的衡量回歸樹(shù)回歸質(zhì)量的指標(biāo),當(dāng)我們?cè)谑褂媒徊骝?yàn)證,或者其他方式獲取回歸樹(shù)的結(jié)果時(shí),我們往往選擇均方誤差作 為我們的評(píng)估(在分類樹(shù)中這個(gè)指標(biāo)是score代表的預(yù)測(cè)準(zhǔn)確率)。在回歸中,我們追求的是,MSE越小越好。 然而,回歸樹(shù)的接口score返回的是R平方(R平方可以為正為負(fù)(如果模型的殘差平方和遠(yuǎn)遠(yuǎn)大于模型的總平方和,模型非常糟糕,R平方就會(huì)為負(fù)),而均方誤差永遠(yuǎn)為正。 ),并不是MSE。








暫無(wú)數(shù)據(jù)