2021-05-26
閱讀量:
3568
Z-score方法如何檢測(cè)異常值
Z-score是一維或低維特征空間中的參數(shù)異常檢測(cè)方法。該技術(shù)假定數(shù)據(jù)服從高斯分布,異常值是分布尾部的數(shù)據(jù)點(diǎn),因此遠(yuǎn)離數(shù)據(jù)的平均值。距離的遠(yuǎn)近取決于使用公式計(jì)算的歸一化數(shù)據(jù)點(diǎn)z i的設(shè)定閾值Zthr:
其中xi是一個(gè)數(shù)據(jù)點(diǎn),μ是所有點(diǎn)xi的平均值,δ是所有點(diǎn)xi的標(biāo)準(zhǔn)偏差。然后經(jīng)過(guò)標(biāo)準(zhǔn)化處理后,異常值也進(jìn)行標(biāo)準(zhǔn)化處理,其絕對(duì)值大于Zthr:
Zthr值一般設(shè)置為2.5、3.0或3.5。






評(píng)論(0)


暫無(wú)數(shù)據(jù)
CDA考試動(dòng)態(tài)
CDA報(bào)考指南
推薦帖子
0條評(píng)論
0條評(píng)論
0條評(píng)論
0條評(píng)論