2018-10-29
閱讀量:
1297
隨機(jī)森林優(yōu)點(diǎn)和注意點(diǎn)
隨機(jī)森林算法的注意點(diǎn):
1、 在構(gòu)建決策樹的過程中是不需要剪枝的。
2、 整個森林的樹的數(shù)量和每棵樹的特征需要人為進(jìn)行設(shè)定。
3、 構(gòu)建決策樹的時候分裂節(jié)點(diǎn)的選擇是依據(jù)最小基尼系數(shù)的。
隨機(jī)森林有很多的優(yōu)點(diǎn):
a. 在數(shù)據(jù)集上表現(xiàn)良好,兩個隨機(jī)性的引入,使得隨機(jī)森林不容易陷入過擬合。
b. 在當(dāng)前的很多數(shù)據(jù)集上,相對其他算法有著很大的優(yōu)勢,兩個隨機(jī)性的引入,使得隨機(jī)森林具有很好的抗噪聲能力。
c. 它能夠處理很高維度(feature很多)的數(shù)據(jù),并且不用做特征選擇,對數(shù)據(jù)集的適應(yīng)能力強(qiáng):既能處理離散型數(shù)據(jù),也能處理連續(xù)型數(shù)據(jù),數(shù)據(jù)集無需規(guī)范化。
d. 在創(chuàng)建隨機(jī)森林的時候,對generlization error使用的是無偏估計。
e. 訓(xùn)練速度快,可以得到變量重要性排序。
f. 在訓(xùn)練過程中,能夠檢測到feature間的互相影響。
g 容易做成并行化方法。
h. 實(shí)現(xiàn)比較簡單。






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論
0條評論