fit和transform沒有任何關(guān)系,僅僅是數(shù)據(jù)處理的兩個(gè)不同環(huán)節(jié),之所以出來fit_transform這個(gè)函數(shù)名,僅僅是為了寫代碼方便,會高效一點(diǎn)。
數(shù)據(jù)預(yù)處理中方法:
fit():對數(shù)據(jù)進(jìn)行擬合,簡單來說,就是求得訓(xùn)練集X的均值,方差,最大值,最小值,這些訓(xùn)練集X固有的屬性。
transform(): 在fit(擬合)的基礎(chǔ)上,進(jìn)行標(biāo)準(zhǔn)化,降維,歸一化等操作(看具體用的是哪個(gè)工具,如PCA,StandardScaler等)。
fit_transform():一般來說對于訓(xùn)練集數(shù)據(jù),我們應(yīng)該對數(shù)據(jù)先進(jìn)行擬合在進(jìn)行標(biāo)準(zhǔn)化處理,fit_transform是fit和transform的組合,既包括了訓(xùn)練又包含了轉(zhuǎn)換。
transform()和fit_transform()二者的功能都是對數(shù)據(jù)進(jìn)行某種統(tǒng)一處理(比如標(biāo)準(zhǔn)化~N(0,1),將數(shù)據(jù)縮放(映射)到某個(gè)固定區(qū)間,歸一化,正則化等),因?yàn)槭褂胒it.transform()是為了找到訓(xùn)練集上的方差和均值,但是在測試集上我們只需要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理而不需要進(jìn)行擬合,所以對測試集進(jìn)行transform()即可。








暫無數(shù)據(jù)