2021-03-30
閱讀量:
1398
決策樹可以處理連續(xù)變量嗎?
問:
決策樹可以處理連續(xù)變量嗎?
答:
在C4.5及以上算法中是可以的,在 C4.5 算法中,增加了對特征變量為連續(xù)值的處理方法。由于連續(xù)屬性的可取值數(shù)目不再有限,因此,不能直接根據(jù)連續(xù)屬性的可取值來對結點進行劃分.此時,連續(xù)屬性離散化技術可派上用場。最簡單的策略是采用二分法。如果輸入特征字段是連續(xù)型變量,則算法首先會對這一列數(shù)進行從小到大的排序,然后選取相鄰的兩個數(shù)的中間數(shù)作為切分數(shù)據(jù)集的備選點,若一個連續(xù)變量有 N 個值,則在 C4.5的處理過程中將產(chǎn)生 N-1個備選切分點,并且每個切分點都代表著一種二叉樹的切分方案。






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論
0條評論