2018-10-26
閱讀量:
888
決策樹的構建
1. ID3算法
ID3算法的核心是在決策樹各個結點上對應信息增益準則選擇特征,遞歸地構建決策樹。
具體方法是:
1)從根結點(root node)開始,對結點計算所有可能的特征的信息增益,選擇信息增益最大的特征作為結點的特征。
2)由該特征的不同取值建立子節(jié)點,再對子結點遞歸地調用以上方法,構建決策樹;直到所有特征的信息增益均很小或沒有特征可以選擇為止;
3)最后得到一個決策樹。
2. C4.5的生成算法
與ID3算法相似,但是做了改進,將信息增益比作為選擇特征的標準。
遞歸構建決策樹:
從數據集構造決策樹算法所需的子功能模塊工作原理如下:得到原始數據集,然后基于最好的屬性值劃分數據集,由于特征值可能多于兩個,因此可能存在大于兩個分支的數據集劃分,第一次劃分之后,數據將被向下傳遞到樹分支的下一個節(jié)點,在此節(jié)點在此劃分數據,因此可以使用遞歸的原則處理數據集。
遞歸結束的條件是:
程序完全遍歷所有劃分數據集的屬性,或者每個分支下的所有實例都具有相同的分類,如果所有實例具有相同的分類,則得到一個葉子節(jié)點或者終止塊,任何到達葉子節(jié)點的數據必然屬于葉子節(jié)點的分類。






評論(0)


暫無數據
推薦帖子
0條評論
0條評論
0條評論