問:
聚類算法中初始質(zhì)心怎么設(shè)置比較合適?
答:
在K-Means中有一個重要的環(huán)節(jié),就是放置初始質(zhì)心。如果有足夠的時間,K-means- 定會收斂,但Inertia可能收斂到局部最小值。是否能夠收斂到真正的最小值很大程度上取決于質(zhì)心的初始化。init就是用來幫助我們決定初始化方式的參數(shù)。初始質(zhì)心放置的位置不同,聚類的結(jié)果很可能也會不一樣,一個好的質(zhì)心選擇可以讓K-Means避免更多的計算,讓算法收斂穩(wěn)定且更快。在之前我們可以使用random_state參數(shù)來控制每次生成的初始質(zhì)心都在相同位置,甚至可以畫學(xué)習(xí)曲線來確定最優(yōu)的random_ state是哪個整數(shù)。
一個random. _state對應(yīng)一個質(zhì)心隨機初始化的隨機數(shù)種子。如果不指定隨機數(shù)種子,則sklearn中的K-Means并不會只選擇一個隨機模式扔出結(jié)果, 而會在每個隨機數(shù)種子下運行多次,并使用結(jié)果最好的一個隨機數(shù)種子來作為初始質(zhì)心。我們可以使用參數(shù)n. _init來選擇,每個隨機數(shù)種子下運行的次數(shù)。這個參數(shù)不常用到,默認10次,如果我們希望運行的結(jié)果更加精確,那我們可以增加這個參數(shù)n_ init的值來增加每個隨機數(shù)種子下運行的次數(shù)。








暫無數(shù)據(jù)