本質(zhì)上差不多,啞變量常用于回歸模型,one-hot在任何模型都可以用
啞變量在pandas的get_dummy方法,one-hot在sklearn,就是不同的庫from sklearn.preprocessing import OneHotEncoder
最常用的編碼:應(yīng)該還是one-hot用的多,pandas機制問題,它需要在內(nèi)存中把數(shù)據(jù)集都讀入進來,要是數(shù)據(jù)量大的話,太消耗資源,one-hot可以讀數(shù)組,因此大規(guī)模數(shù)據(jù)集很方便