導(dǎo)入相關(guān)庫(kù):

導(dǎo)入數(shù)據(jù)
為了開(kāi)始執(zhí)行離群值測(cè)試,我們將導(dǎo)入一些每10分鐘采樣的平均風(fēng)速數(shù)據(jù)


說(shuō)明:在任何數(shù)據(jù)集中, outlier
都是與其他數(shù)據(jù)點(diǎn)不一致的基準(zhǔn)點(diǎn)。 如果從特定分布采樣的數(shù)據(jù)具有高概率,則異常值將不屬于該分布。 如果特定點(diǎn)是異常值,則有各種測(cè)試用于測(cè)試,這是通過(guò)常態(tài)測(cè)試中使用的相同的空假設(shè)測(cè)試來(lái)完成的。
Q測(cè)試
Dixon的Q-Test用于幫助確定是否有證據(jù)表明某個(gè)點(diǎn)是一維數(shù)據(jù)集的異常值。 假設(shè)數(shù)據(jù)集是正態(tài)分布的。 由于我們有非常有力的證據(jù)表明我們的數(shù)據(jù)集在所有正態(tài)檢驗(yàn)都是正態(tài)分布 ,因此我們可以在此處使用Q-Test。 與正太檢驗(yàn)一樣,我們假設(shè)顯著性水平為0.05美元,為簡(jiǎn)單起見(jiàn),我們只考慮集合中的最小基準(zhǔn)點(diǎn)。

對(duì)于我們的示例,Q統(tǒng)計(jì)量是集合中最小和最接近數(shù)字之間的絕對(duì)距離與數(shù)據(jù)集范圍的比率。 這意味著:

對(duì)于我們的示例,我們將從包含完整數(shù)據(jù)集中的最小值的數(shù)據(jù)集中獲取30個(gè)值,并對(duì)該樣本應(yīng)用測(cè)試。 然后我們將數(shù)組轉(zhuǎn)換為列表并通過(guò)增加值對(duì)其進(jìn)行排序。









暫無(wú)數(shù)據(jù)