国产成人精品福利一区二区,8090成年在线看片午夜福利

yuechuchen

2020-06-21 閱讀量: 2200

K-Means算法原理及改進(jìn)

1.k-means原理：第一步選取K個點(diǎn)作為質(zhì)心；第二步計算所有樣本點(diǎn)到所有質(zhì)心的距離；第三步，把這些距離進(jìn)行排序，從中找出單個樣本點(diǎn)距離最近的質(zhì)心并把該樣本點(diǎn)劃分到最近質(zhì)心所代表的類中；第四步，計算得出剛聚成的各簇的真正質(zhì)心；第五步重新計算所有樣本點(diǎn)到各個新質(zhì)心的距離，依次重復(fù)上述過程知道最后無論怎樣迭代，所有的質(zhì)心和樣本點(diǎn)歸屬的類都不再發(fā)生變動，或者達(dá)到設(shè)定的最大迭代次數(shù)或者每次質(zhì)心變動的量小于設(shè)定值，迭代結(jié)束，聚類完成。

2.改進(jìn)：a. kmeans++：初始隨機(jī)點(diǎn)選擇盡可能遠(yuǎn)，避免陷入局部解。方法是n+1個中心點(diǎn)選擇時，對于離前n個點(diǎn)更遠(yuǎn)的點(diǎn)被選擇到的概率更大b. mini batch kmeans：每次只用一個子集做重入類并找到類心（提高訓(xùn)練速度）c. ISODATA：對于難以確定k的時候，使用該方法。思路是當(dāng)類下的樣本小時，剔除；類下樣本數(shù)量多時，拆分d. kernel kmeans：kmeans用歐氏距離計算相似度，也可以使用kernel映射到高維空間再聚類