2018-10-16
閱讀量:
1951
怎樣實(shí)現(xiàn)數(shù)據(jù)的歸一化和標(biāo)準(zhǔn)化?
嚴(yán)謹(jǐn)來(lái)說(shuō),歸一化只是標(biāo)準(zhǔn)化的一種方式,最常見(jiàn)的是以下兩種:
1、min-max標(biāo)準(zhǔn)化(Min-max normalization)
x*=(x-min)/(max-min)
可映射到[0,1],若為了映射到[-1,1],則在此基礎(chǔ)上2x*-1
注:這種方法有一個(gè)缺陷就是當(dāng)有新數(shù)據(jù)加入時(shí),可能導(dǎo)致max和min的變化,需要重新定義。
2、z-score標(biāo)準(zhǔn)化(zero-mean normalization)
x*=(x-μ)/σ
其中μ為所有樣本數(shù)據(jù)的均值,σ為所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差。經(jīng)過(guò)處理后的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,前提是要求原始數(shù)據(jù)近似符合正態(tài)分布
3、此外還有l(wèi)og函數(shù)轉(zhuǎn)換atan函數(shù)轉(zhuǎn)換等
x*=log10(x)/log10(max)
x*=atan(x)*2/π






評(píng)論(0)


暫無(wú)數(shù)據(jù)
CDA考試動(dòng)態(tài)
CDA報(bào)考指南
推薦帖子
0條評(píng)論
0條評(píng)論
0條評(píng)論
0條評(píng)論