2020-06-18
閱讀量:
1507
機器學(xué)習(xí)第二天作業(yè)知識點整理
KMeans的原理
- 先從沒有標(biāo)簽的元素集合A中隨機取k個元素作為k個子集各自的中心
- 分別計算剩下的元素到k個子集中心的距離,將這些元素分別劃歸到最近的子集
- 根據(jù)聚類結(jié)果,重新計算中心(子集中所有元素各個維度的算數(shù)平均數(shù))
- 將集合A中全部元素按照新的中心然后再重新聚類
- 重復(fù)以上步驟,直到聚類的結(jié)果不再發(fā)生變化
KMeans的優(yōu)點
- 原理比較簡單,實現(xiàn)也很容易,收斂速度快。
- 球狀聚類效果較優(yōu)。
- 算法的可解釋度比較強。
- 主要需要調(diào)參的參數(shù)僅僅是簇數(shù)k。
KMeans的缺點
- K值的選取不好把握,需要自己選擇。
- 對于不是凸的數(shù)據(jù)集比較難收斂。
- 如果各隱含類別的數(shù)據(jù)不平衡,比如各隱含類別的數(shù)據(jù)量嚴(yán)重失衡,或者各隱含類別的方差不同,則聚類效果不佳。
- 采用迭代方法,得到的結(jié)果只是局部最優(yōu)。
- 對離群點和孤立點比較敏感。
- 初始聚類中心需要多次選擇。






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論
0條評論