2021-04-26
閱讀量:
2459
訓(xùn)練集、測試集、驗(yàn)證集有什么區(qū)別?
訓(xùn)練集(train set) —— 用于模型擬合的數(shù)據(jù)樣本。
驗(yàn)證集(development set)—— 是模型訓(xùn)練過程中單獨(dú)留出的樣本集,它可以用于調(diào)整模型的超參數(shù)和用于對模型的能力進(jìn)行初步評估。
在神經(jīng)網(wǎng)絡(luò)中, 我們用驗(yàn)證數(shù)據(jù)集去尋找最優(yōu)的網(wǎng)絡(luò)深度(number of hidden layers),或者決定反向傳播算法的停止點(diǎn)或者在神經(jīng)網(wǎng)絡(luò)中選擇隱藏層神經(jīng)元的數(shù)量;
在普通的機(jī)器學(xué)習(xí)中常用的交叉驗(yàn)證(Cross Validation) 就是把訓(xùn)練數(shù)據(jù)集本身再細(xì)分成不同的驗(yàn)證數(shù)據(jù)集去訓(xùn)練模型。
測試集 —— 用來評估模最終模型的泛化能力。但不能作為調(diào)參、選擇特征等算法相關(guān)的選擇的依據(jù)。






評論(0)


暫無數(shù)據(jù)
CDA考試動態(tài)
CDA報(bào)考指南
推薦帖子
0條評論
0條評論
0條評論