2021-05-20
閱讀量:
486
提問:n_estimators份采樣集怎么做?
需要做n_estimators份采樣集, 可以嘗試使用dataframe的形式幫助做(效率低)
# 首先將訓(xùn)練集的特征和標(biāo)簽拼在一起,因?yàn)樽霾蓸拥臅r(shí)候,樣本的特征和標(biāo)簽都同時(shí)來做采樣
train = pd.DataFrame(Xtrain)
train['label'] = Ytrain
data_train_ = []
for i in range(n_estimators):
# 每次循環(huán)的過程中,使用dataframe.sample這個(gè)函數(shù)來進(jìn)行有放回的隨機(jī)采樣
# 生成采樣集,這個(gè)采樣集是小dataframe,有特征和標(biāo)簽
sub = train.sample(frac = 0.9, replace = True)
# 分開特征和標(biāo)簽,做成一個(gè)小元組追要空l(shuí)ist當(dāng)中
sub_X, sub_Y = sub.iloc[:, :-1], sub.iloc[:, -1]
data_train_.append((sub_X, sub_Y))






評(píng)論(0)


暫無(wú)數(shù)據(jù)
CDA考試動(dòng)態(tài)
CDA報(bào)考指南
推薦帖子
0條評(píng)論
0條評(píng)論
0條評(píng)論