
SPSS:T檢驗(yàn)、方差分析、非參檢驗(yàn)、卡方檢驗(yàn)的使用要求和適用場景
一、T檢驗(yàn)
1.1 樣本均值比較T檢驗(yàn)的使用前提
正態(tài)性;(單樣本、獨(dú)立樣本、配對樣本T檢驗(yàn)都需要)
連續(xù)變量;(單樣本、獨(dú)立樣本、配對樣本T檢驗(yàn)都需要)
獨(dú)立性;(獨(dú)立樣本T檢驗(yàn)要求)
方差齊性;(獨(dú)立樣本T檢驗(yàn)要求)
1.2 樣本均值比較T檢驗(yàn)的適用場景
單樣本T檢驗(yàn)(比較樣本均數(shù)和總體均數(shù));
操作:打開 分析—比較均值—單樣本t檢驗(yàn)
要求:正態(tài)性(可以用K-S檢驗(yàn)法,在SPSS中的“分析”–“非參數(shù)檢驗(yàn)”—“單樣本”中;或者直接根據(jù)直方圖、P-P圖,Q-Q圖來觀察或根據(jù)偏度峰度法來分析)
說明:由中心極限定理可知,即使原數(shù)據(jù)不符合正態(tài)分布,只要樣本量足夠大時樣本均數(shù)分布仍然是正態(tài)的。只要數(shù)據(jù)不是強(qiáng)烈的偏正態(tài),沒有明顯的極端值,一般而言單樣本t檢驗(yàn)都是可以使用的,分析結(jié)果都是穩(wěn)定的。
獨(dú)立樣本T檢驗(yàn)(比較成組設(shè)計的兩個樣本);
操作:打開 分析—比較均值—獨(dú)立樣本t檢驗(yàn)
我們輸入數(shù)據(jù)的時候,兩個樣本的數(shù)據(jù)是要在一列變量里的,另外還有一列二分類變量為這列因變量做標(biāo)注。
要求:獨(dú)立性、正態(tài)性(對正態(tài)性有耐受性)、方差齊性(影響大,檢驗(yàn)更有必要,使用Levene’s檢驗(yàn),兩樣本T檢驗(yàn)中提供Levene’s檢驗(yàn),如需更詳細(xì)的檢驗(yàn)結(jié)果可在“分析”–“描述統(tǒng)計”–“探索”中進(jìn)行)
說明:各樣本相互獨(dú)立,且均來自于正態(tài)分布的樣本,各樣本所在總體的方差相等;
* 疑問:獨(dú)立性怎么檢驗(yàn)?有些數(shù)據(jù)可以根據(jù)現(xiàn)實(shí)環(huán)境判斷;*
配對樣本T檢驗(yàn)(如用藥前和用藥后的兩個人群的樣本、同一樣品用兩種方法的比較)
操作:打開 分析—比較均值—配對樣本t檢驗(yàn)
要求:正態(tài)性(配對樣本等價于單樣本T檢驗(yàn),檢驗(yàn)的是兩個樣本對應(yīng)的差值,初始假設(shè)為差值等于0)
二、單因素方差分析
2.1 單因素方差分析的基本思想
基本思想:變異分解,總變異=隨機(jī)變異+處理因素導(dǎo)致的變異,又可以分解為總變異=組內(nèi)變異+組間變異,F(xiàn)=組間變異/組內(nèi)變異,F(xiàn)的值越大,處理因素的影響越大。
2.2 單因素方差分析的使用前提
獨(dú)立性:不滿足獨(dú)立性會有很大的影響,因?yàn)樾畔⒋嬖凇爸丿B”的部分
疑問:在哪兒可以驗(yàn)證?卡方檢驗(yàn)?卡方檢驗(yàn)檢驗(yàn)的是兩個分類變量
正態(tài)性:對正態(tài)性的要求是穩(wěn)健的
方差齊性:檢驗(yàn)方法除了Levene’s檢驗(yàn),還可以有其他的檢驗(yàn)方法:Bartleet法(比較各組方差的加權(quán)算數(shù)平均數(shù)和幾何均數(shù))、Hartley法(樣本量相同時使用)、Cochran法(樣本量相同時使用)。
方差分析對變量的類型有要求嗎?應(yīng)該分析的都是連續(xù)變量
2.3 單因素方法分析的使用前提不滿足時變換方法
對數(shù)變換、平方根變換、平方根反正弦變換、平方變換、倒數(shù)變換、Box-Cox變換(分段函數(shù))
2.4 單因素方差分析的適用場景
T檢驗(yàn)只能檢驗(yàn)兩組樣本的均數(shù)差,多組樣本的時候就需采用方差分析;
操作:打開分析—比較均值—均值 進(jìn)行預(yù)分析,可以大致看出各均值是否相同,方差是否齊性;再進(jìn)行 打開 分析—比較均值—單因素anova;
適用場景:均數(shù)間的多重比較(全部兩兩比較)、各組均數(shù)的精細(xì)比較(可以指定要比較的兩個組,通過設(shè)定系數(shù))、組間均數(shù)的趨勢檢驗(yàn)(為了利用分組變量中體現(xiàn)出的次序信息,目的不是為了擬合線性或非線性的模型,而是希望知道因素的水平改變時均數(shù)的變化趨勢)
2.5 方差分析結(jié)束后如均值不同可進(jìn)行兩兩比較(事前比較、事后比較)
LSD法:用于事先計劃好的比較,最靈敏;檢驗(yàn)水準(zhǔn)沒有校正,每次都是α
Sidak法:第二靈敏;
Bonferroni法:用于事先計劃好的比較,第三靈敏;
Scheffe法:多用樣本含量不等的情況,第四靈敏;
Dunnett法:常用于多個實(shí)驗(yàn)組和一個對照組的比較,第五靈敏;
尋找同質(zhì)亞組的檢驗(yàn)方法:
S-N-K法:將所有樣本分為多個子集;
Tukey法:任意兩組比較,要求樣本含量相同,MEER不超過α;
Duncan法:與SNK法類似;
備注:
CER:每進(jìn)行一次比較犯一類錯誤錯誤的概率;
EERC:完全無效假設(shè)檢驗(yàn)下,做完全部比較犯一類錯誤的概率;
MEER:部分或者任何完全假設(shè)下,犯一類錯誤的最大概率值,即最大實(shí)驗(yàn)誤差率。
疑問:單因素方差分析的事前檢驗(yàn)和事后檢驗(yàn)有什么區(qū)別,為什么結(jié)果不同??
三、非參數(shù)檢驗(yàn)
3.1 非參數(shù)檢驗(yàn)的基本思想
非參數(shù)檢驗(yàn)的意思是指整個推斷過程和結(jié)論均和原總體參數(shù)無關(guān),而不是不利用參數(shù)
3.2 非參數(shù)檢驗(yàn)的優(yōu)勢
穩(wěn)健性;
對數(shù)據(jù)的測量尺度、數(shù)據(jù)類型無約束;
適用于小樣本、無分布樣本、數(shù)據(jù)污染樣本、混雜樣本等;
3.3 非參數(shù)檢驗(yàn)使用前提
有序、名義變量,這類數(shù)據(jù)的分布形態(tài)一般未知,均值方差等數(shù)據(jù)無意義;
樣本分布未知;
樣本數(shù)據(jù)不滿足正態(tài)分布,即便是經(jīng)過變量變換;
方差齊性不滿足,即便是經(jīng)過變量變換;
總體分布正態(tài),連續(xù)變量,但樣本容量極小,如10以下;
3.2 非參數(shù)檢驗(yàn)適用情形
單樣本非參數(shù)檢驗(yàn)
K-S檢驗(yàn):針對連續(xù)變量,考察是否符合正態(tài)分布
操作:打開–分析–非參數(shù)檢驗(yàn)–單樣本
二項(xiàng)分布檢驗(yàn):針對兩分類變量,考察是否符合二項(xiàng)分布
操作:打開–分析–非參數(shù)檢驗(yàn)–單樣本
游程檢驗(yàn):考察總體的隨機(jī)性
操作:打開–分析–非參數(shù)檢驗(yàn)–單樣本
兩個獨(dú)立樣本的非參數(shù)檢驗(yàn)(無效假設(shè)為兩樣本的中心位置是否相等)
Mann-Whitney U檢驗(yàn),兩樣本秩和檢驗(yàn),應(yīng)用范圍最廣;
Kolmogorov-Smirnov Z檢驗(yàn):檢驗(yàn)兩個樣本的累積頻數(shù)分布曲線,判斷兩個樣本的分布是否相同;
Moses Extreme Reactions 檢驗(yàn):Moses極端反應(yīng)檢驗(yàn),單側(cè)檢驗(yàn)
Wald-Wolfowitz Runs 檢驗(yàn):單側(cè)檢驗(yàn),無論是集中趨勢、離散趨勢、偏度的波動情況都能檢測出來,如果只是檢查中心位置,最好不用,檢驗(yàn)兩樣本是否來自同樣的分布;
操作:打開 分析—非參數(shù)檢驗(yàn)—獨(dú)立樣本
多個獨(dú)立樣本的非參數(shù)檢驗(yàn)
Kruskal-Wallis H檢驗(yàn)(類似Wilcoxon符號秩檢驗(yàn),兩樣本在多樣本上的推廣)
中位數(shù)檢驗(yàn)
Jonckheere-Terpstra檢驗(yàn):對連續(xù)變量和有序分類資料都使用,分組變量為有序分類資料時,檢驗(yàn)效能要高于Kruskal-Wallis H檢驗(yàn)
操作:打開 分析—非參數(shù)檢驗(yàn)—獨(dú)立樣本
兩個配對樣本(求出差值,查看中位數(shù)是否為0,目的就是為了檢驗(yàn)均值是否相等)
sign符號檢驗(yàn):只利用了符號信息,差值是否一半為正一半為負(fù);
Wilcoxon符號秩檢驗(yàn):利用了符號和差值的大小順序(符號+秩序)
操作:打開 分析—非參數(shù)檢驗(yàn)—相關(guān)樣本
多個相關(guān)樣本非參數(shù)檢驗(yàn)
Friedman 檢驗(yàn):基本思想是同區(qū)組的處理值和計算的秩比較才有意義,還附帶齊性子集結(jié)果給出了準(zhǔn)確的兩兩比較信息;
Kendall協(xié)和系數(shù)檢驗(yàn):為了檢驗(yàn)各組評價是否一致,F(xiàn)riedman檢驗(yàn)只能說明尚不能認(rèn)為有差異,但是無法評判一致性,Kendall方法針對連續(xù)變量,
Cochran檢驗(yàn):有些評價只能用是否、好壞等二元數(shù)據(jù)來判斷,Cochran只適用于二分類變量,用Kendall方法會有很多的打結(jié)現(xiàn)象。
操作:打開 分析–非參數(shù)檢驗(yàn)–相關(guān)樣本
通用方法—秩變換分析方法
前面有關(guān)秩的分析方法其實(shí)都是秩變換方法的不同應(yīng)用,分析方法中可以直接將秩求出后再進(jìn)行分析。
操作:轉(zhuǎn)換 — 個案排秩(也可以指定生成符合正態(tài)分布的秩)
四、卡方檢驗(yàn)
4.1 卡方檢驗(yàn)的基本思想
以卡方分布為基礎(chǔ),計算觀察值和期望值之間的偏離程度;
4.2 卡方檢驗(yàn)的使用前提
最小期望頻數(shù)均大于1
至少4/5的單元格期望頻數(shù)大于5
計算時如果單元格期望頻數(shù)小于5要和其他種類合并
樣本觀察值量超過50
4.3 卡方檢驗(yàn)的使用目的
考察無序分類變量各水平在兩組或多組間的分布是否一致;
檢驗(yàn)?zāi)硞€連續(xù)變量的分布是否和理論分布一致;
分類變量的概率是否等于指定概率;
檢驗(yàn)兩個分類變量是否獨(dú)立;
檢驗(yàn)控制了其中幾個因素后,剩余的兩個分類變量是否獨(dú)立;
檢驗(yàn)兩種方法的結(jié)果是否一致;
4.4 卡方檢驗(yàn)的適用場景
單樣本卡方檢驗(yàn)
操作: 打開 分析–非參數(shù)檢驗(yàn)–單樣本
兩樣本卡方檢驗(yàn)
操作: 打開 分析–描述統(tǒng)計–交叉表
兩分類變量間關(guān)聯(lián)程度的度量:定性描述兩個分類變量是否存在關(guān)聯(lián)(更為詳細(xì)的可以根據(jù)相關(guān)分析)
操作: 打開 分析–描述統(tǒng)計–交叉表
Kappa一致性檢驗(yàn)(用于配對樣本,如兩個人針對一個事物的評價)
用于配對樣本的檢驗(yàn),Kappa檢驗(yàn)的結(jié)果是兩個人的評價是否是相關(guān)的
操作: 打開 分析–描述統(tǒng)計–交叉表
Mcnemar 配對卡方檢驗(yàn)
Kappa檢驗(yàn)只能看出兩者是否有關(guān)聯(lián),但是不能判斷是否一致,Mcnemar 配對卡方檢驗(yàn)就可以解決兩者是否一致的問題
操作: 打開 分析–描述統(tǒng)計–交叉表
分層卡方檢驗(yàn)
可以控制一個因素,如收入對車輛購買率的影響,可以將城市作為分層因素,從而可以得到更準(zhǔn)確的結(jié)果,但是SPSS中只能進(jìn)行兩分類變量的檢驗(yàn),不能進(jìn)行多分類的檢驗(yàn),且分層因素和要分析的因素之間如果存在交互關(guān)系也不能進(jìn)行檢驗(yàn)。
操作: 打開 分析–描述統(tǒng)計–交叉表
4.5 備注
相對危險度(RR)
RR=試驗(yàn)人群反應(yīng)陽性的概率/對照組人群反應(yīng)陽性的概率
RR=1,說明試驗(yàn)因素反應(yīng)陽性沒有關(guān)聯(lián)
RR<1,說明試驗(yàn)因素導(dǎo)致反應(yīng)陽性的發(fā)生率降低
RR>1,說明試驗(yàn)因素導(dǎo)致反應(yīng)陽性的發(fā)生率升高
優(yōu)勢比(OR)
OR=(反應(yīng)陽性組中實(shí)驗(yàn)因素陽性人數(shù)/反應(yīng)陽性組中實(shí)驗(yàn)因素陰性人數(shù))/(反應(yīng)陰性組中實(shí)驗(yàn)因素陽性人數(shù)/反應(yīng)陰性組中實(shí)驗(yàn)因素陰性人數(shù))
OR>1,說明該試驗(yàn)因素更容易導(dǎo)致實(shí)驗(yàn)結(jié)果為陽性
推薦學(xué)習(xí)書籍
《CDA一級教材》適合CDA一級考生備考,也適合業(yè)務(wù)及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計已有10萬+在讀~
免費(fèi)加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03