99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
2018-11-22 閱讀量: 1111
k-means聚類的分析原理是什么?

通常,對原始數(shù)據(jù)表執(zhí)行k -means聚類分析其中每行表示對象,列表示對象的定量特征。這些定量特征稱為聚類變量。例如,表中有18個對象,并且有兩個聚類變量xy。在實際應(yīng)用程序中,通常會有更多對象和更多變量。例如,在市場細分中,其中k-means用于查找具有相似需求的消費者群體,每個對象是一個人,每個變量通常是對各種事物對消費者的重要程度(例如,質(zhì)量,價格,客戶服務(wù),便利性)的評級。

步驟1:指定簇數(shù)(k)。k -means的第一步是指定簇的數(shù)量,稱為k。傳統(tǒng)上,研究人員將多次進行k -means,探索不同數(shù)量的聚類(例如,從2到10)。

步驟2:將對象分配給群集。最直接的方法是將對象隨機分配給集群,但還有許多其他方法(例如,使用分層集群)。在下圖中,18個對象在散點圖上用點表示,其中x由每個對象的水平位置顯示,y由垂直顯示。對象已被隨機分配到兩個聚類(k = 2),其中一個聚類顯示為填充點,另一個聚類顯示未填充點。

步驟3:計算集群意味著。對于每個簇,計算每個變量的平均值。在下圖中,由點的水平位置(x)表示的變量的填充點的平均值約為15;對于垂直維度上的變量,它大約是12。這兩種方式用實心十字表示?;蛘?,略有不同:填充的十字架位于黑點的中間。同樣,白色十字位于白點的中間。這些交叉被不同地稱為聚類中心,聚類均值聚類中心。

步驟4:將每個觀察分配到最近的聚類中心。在上圖中,一些填充點更接近白色十字,一些白點更接近黑色十字。

步驟5:重復(fù)步驟3和4,直到解收斂??纯瓷厦娴膱D,我們可以看到十字架(集群意味著)不再準(zhǔn)確。在下面的圖中,它們已經(jīng)使用步驟3重新計算。在該示例中,聚類分析已經(jīng)收斂(即,重新分配觀察和更新裝置不能改進解決方案)。在具有更多數(shù)據(jù)的示例中,通常需要更多次迭代(即,重復(fù)步驟3和4直到?jīng)]有響應(yīng)者改變?nèi)杭?/span>

0.0000
2
關(guān)注作者
收藏
評論(0)

發(fā)表評論

暫無數(shù)據(jù)
推薦帖子