歸一化和標(biāo)準(zhǔn)化的區(qū)別:
歸一化是將樣本的特征值轉(zhuǎn)換到同一量綱下把數(shù)據(jù)映射到[0,1]或者[-1, 1]區(qū)間內(nèi),僅由變量的極值決定,因區(qū)間放縮法是歸一化的一種。標(biāo)準(zhǔn)化是依照特征矩陣的列處理數(shù)據(jù),其通過求z-score的方法,轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布,和整體樣本分布相關(guān),每個(gè)樣本點(diǎn)都能對(duì)標(biāo)準(zhǔn)化產(chǎn)生影響。它們的相同點(diǎn)在于都能取消由于量綱不同引起的誤差;都是一種線性變換,都是對(duì)向量X按照比例壓縮再進(jìn)行平移。
歸一化和標(biāo)準(zhǔn)化它們都是指特征工程中的特征縮放過程,直接看它們的作用和操作方法,可能會(huì)更容易理解。
使用特征縮放的作用是:
使不同量綱的特征處于同一數(shù)值量級(jí),減少方差大的特征的影響,使模型更準(zhǔn)確。
加快學(xué)習(xí)算法的收斂速度。
縮放過程可以分為以下幾種:
縮放到均值為0,方差為1(Standardization——StandardScaler())
縮放到0和1之間(Standardization——MinMaxScaler())
縮放到-1和1之間(Standardization——MaxAbsScaler())
縮放到0和1之間,保留原始數(shù)據(jù)的分布(Normalization——Normalizer())








暫無數(shù)據(jù)