
數(shù)據(jù)分析技術(shù):事后多重比較的方法介紹;了解各種方法的原理才能做到“準(zhǔn)確分析”
基礎(chǔ)準(zhǔn)備
均值比較的假設(shè)檢驗是數(shù)據(jù)分析最重要的分析內(nèi)容之一,根據(jù)參與比較的樣本數(shù)量不同,使用的假設(shè)檢驗方法也不同,做個簡要的總結(jié):
一個總體均值與一個常數(shù)進(jìn)行比較(Z檢驗和T檢驗);
兩個總體均值之間的比較(Z檢驗和T檢驗);
三個及三個以上總體均值的比較(方差分析);
與Z檢驗和T檢驗不同,方差分析的結(jié)果只能檢驗出三個以上的總體均值是完全相同呢?還是不完全相同?注意是不完全相同,至于是哪個或哪些總體均值與其它總體均值不同則是不能獲知的。因此方差分析結(jié)束以后還需要做事后多重檢驗,分析出到底是哪個或哪些總體均值與眾不同。
今天我們要介紹的是進(jìn)行事后多重檢驗的方法介紹。如果對方差分析還不太熟悉的朋友可以點擊下面的鏈接回顧:
數(shù)據(jù)分析技術(shù):方差分析原理;
數(shù)據(jù)分析理論:方差分析模型;
很多朋友會有疑問,為什么方差分析一定要進(jìn)行事后多重比較呢?直接用獨立樣本T檢驗進(jìn)行多次兩兩比較不是也可以嗎?我們可以用一個例子說明這個原因:以方差分析為例,假如有5個樣本,如果要進(jìn)行多次均值的兩兩比較,那么兩兩比較的次數(shù)多達(dá)10次。設(shè)每次比較的顯著性水平等于0.05,那么10次比較都不犯“棄真”錯誤的概率為(1-0.05)的十次方,也就是0.60左右,也就是說犯“棄真”錯誤的概率高達(dá)0.40,這遠(yuǎn)遠(yuǎn)大于原先設(shè)定的顯著性水平0.05。不僅如此,隨著比較組數(shù)的增多,犯“棄真”錯誤的概率也會越來越大。
應(yīng)用SPSS進(jìn)行方差分析時,給分析者提供了很多事后多重檢驗的方法,如下圖所示。這些方法根據(jù)多個總體方差是否相等分成了兩大類。
事后多重檢驗的方法很多,但并不是說它們?nèi)绨倩R放般的襯托了統(tǒng)計學(xué)的欣欣向榮,而是說明到目前為止仍然沒有統(tǒng)一的解決方法,因此才根據(jù)不同的目的和數(shù)據(jù)情況創(chuàng)造出了很多不同的方法。
兩兩比較的方法
LSD法:最小顯著性差異法(Least Significance Difference),是最簡單的比較方法之一。它是t檢驗的一個簡單變形,并未對檢驗水準(zhǔn)做出任何校正,只是在標(biāo)準(zhǔn)誤(注意不是標(biāo)準(zhǔn)差)的計算上充分考慮了所有總體水平的樣本信息,估計出了一個更為穩(wěn)健的標(biāo)準(zhǔn)誤。因為單次比較的顯著性水平a保持不變,所以LSD法是最靈敏的事后多重比較法。
Sidak法:Sidak校正在LSD法上的應(yīng)用。通過Sidak校正降低每次兩兩比較的“棄真”錯誤概率,以使最終整個比較的“棄真”錯誤概率保持為顯著性水平a。這也就是說每次比較的顯著性水平a會隨著比較次數(shù)的增多而減小。顯然,Sidak法比LSD法的靈敏度低。每次進(jìn)行Sidak比較的顯著性水平為:
Bonferroni法:與Sidak法類似,它的每一次比較實際上是Bonferroni校正在LSD法上的應(yīng)用。Bonferroni法修正后每次比較的顯著性水平比Sidak法的更小,也就是說Bonferroni法比Sidak法的靈敏度更低。
Scheffe法:Scheffe法的實質(zhì)是對多個總體均值間的線性組合是否為0進(jìn)行假設(shè)檢驗。多用在兩組樣本含量不同的情況。
Dunnett法:常用于多個試驗組與一個對照組間的比較。因此在指定Dunnett法時,還應(yīng)當(dāng)指定對照組。
以上五種方法的排列順序是按照靈敏度從高到低排列的,LSD法>Sidak法>Bonferroni法>Scheffe法>Dunnett法。
形成同質(zhì)亞組的方法
SNK法:全稱為Student-Newman-Keuls法。它實質(zhì)上是根據(jù)預(yù)先指定的準(zhǔn)則將各組均值分為多個亞組,利用Studentized Range分布來進(jìn)行假設(shè)檢驗,并根據(jù)所要檢驗的均值個數(shù)調(diào)整總的“棄真”錯誤概率不超過設(shè)定的顯著性水平a。
Tukey法:全稱為Tukey' s Honestly Significant Difference法。應(yīng)用這種方法要求各組樣本含量相同。它也是利用Studentized Range分布來進(jìn)行各組均數(shù)間的比較,與SNK法不同地是,它控制所有比較中最大的“棄真”錯誤概率不超過設(shè)定的顯著性水平a。
Duncan法:其思路與SNK法相類似,只不過檢驗統(tǒng)計量服從的是Duncan' s Multiple Range分布。
以上8種是常用的事后多重檢驗方法(各水平樣本的方差齊性),剩下的六種方法并不常用,這里就不在介紹。除此之外,在各組樣本方差不齊時,SPSS還提供了4種事后多重檢驗的方法,但從方法的接受程度和結(jié)果的穩(wěn)健性講,希望大家盡量不要在方差不齊時進(jìn)行方差分析甚至兩兩比較,采用變量變換或者非參數(shù)檢驗往往更可靠。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03