2019-03-15
閱讀量:
675
異常值如何處理?
問題描述:
像政府那些數(shù)據(jù),即使有3倍外的異常值也要處理嗎?處理的方法怎么選擇?
答案解析:
要處理,方法如下:
1. 蓋帽法(推薦)
整行替換數(shù)據(jù)框里99%以上和1%以下的點,將99%以上的點值=99%的點值;小于1%的點值=1%的點值,即替換成3倍標準差容忍值最大的值
2. 分箱法(推薦)
將連續(xù)變量等級化之后,不同的分位數(shù)的數(shù)據(jù)就會變成不同的等級數(shù)據(jù),連續(xù)變量離散化了,消除了極值的影響。
3. 均值替換法






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論
0條評論