問:
python中make_blobs生成的數(shù)據(jù)是隨機(jī)的嗎?random_state=r是什么意思?
答:
是的,python中make_blobs生成的數(shù)據(jù)是隨機(jī)的,scikit中的make_blobs方法常被用來(lái)生成聚類算法的測(cè)試數(shù)據(jù),直觀地說,
make_blobs會(huì)根據(jù)用戶指定的特征數(shù)量、中心點(diǎn)數(shù)量、范圍等來(lái)生成幾類數(shù)據(jù),這些數(shù)據(jù)可用于測(cè)試聚類算法的效果。其語(yǔ)法如下:
sklearn.datasets.make_blobs(n_samples=100, n_features=2,centers=3, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)
random_state=r表示設(shè)置生成隨機(jī)數(shù)的種子為r(r為整數(shù)),其他比較常用的參數(shù)說明如下:
n_samples是待生成的樣本的總數(shù)。
n_features是每個(gè)樣本的特征數(shù)。
centers表示類別數(shù)。
cluster_std表示每個(gè)類別的方差,例如我們希望生成2類數(shù)據(jù),其中一類比另一類具有更大的方差,可以將cluster_std設(shè)置為[1.0,3.0]。








暫無(wú)數(shù)據(jù)