
SPSS:T檢驗、方差分析、非參檢驗、卡方檢驗的使用要求和適用場景
一、T檢驗
1.1 樣本均值比較T檢驗的使用前提
正態(tài)性;(單樣本、獨立樣本、配對樣本T檢驗都需要)
連續(xù)變量;(單樣本、獨立樣本、配對樣本T檢驗都需要)
獨立性;(獨立樣本T檢驗要求)
方差齊性;(獨立樣本T檢驗要求)
1.2 樣本均值比較T檢驗的適用場景
單樣本T檢驗(比較樣本均數(shù)和總體均數(shù));
操作:打開 分析—比較均值—單樣本t檢驗
要求:正態(tài)性(可以用K-S檢驗法,在SPSS中的“分析”–“非參數(shù)檢驗”—“單樣本”中;或者直接根據(jù)直方圖、P-P圖,Q-Q圖來觀察或根據(jù)偏度峰度法來分析)
說明:由中心極限定理可知,即使原數(shù)據(jù)不符合正態(tài)分布,只要樣本量足夠大時樣本均數(shù)分布仍然是正態(tài)的。只要數(shù)據(jù)不是強烈的偏正態(tài),沒有明顯的極端值,一般而言單樣本t檢驗都是可以使用的,分析結(jié)果都是穩(wěn)定的。
獨立樣本T檢驗(比較成組設(shè)計的兩個樣本);
操作:打開 分析—比較均值—獨立樣本t檢驗
我們輸入數(shù)據(jù)的時候,兩個樣本的數(shù)據(jù)是要在一列變量里的,另外還有一列二分類變量為這列因變量做標注。
要求:獨立性、正態(tài)性(對正態(tài)性有耐受性)、方差齊性(影響大,檢驗更有必要,使用Levene’s檢驗,兩樣本T檢驗中提供Levene’s檢驗,如需更詳細的檢驗結(jié)果可在“分析”–“描述統(tǒng)計”–“探索”中進行)
說明:各樣本相互獨立,且均來自于正態(tài)分布的樣本,各樣本所在總體的方差相等;
* 疑問:獨立性怎么檢驗?有些數(shù)據(jù)可以根據(jù)現(xiàn)實環(huán)境判斷;*
配對樣本T檢驗(如用藥前和用藥后的兩個人群的樣本、同一樣品用兩種方法的比較)
操作:打開 分析—比較均值—配對樣本t檢驗
要求:正態(tài)性(配對樣本等價于單樣本T檢驗,檢驗的是兩個樣本對應(yīng)的差值,初始假設(shè)為差值等于0)
二、單因素方差分析
2.1 單因素方差分析的基本思想
基本思想:變異分解,總變異=隨機變異+處理因素導(dǎo)致的變異,又可以分解為總變異=組內(nèi)變異+組間變異,F(xiàn)=組間變異/組內(nèi)變異,F(xiàn)的值越大,處理因素的影響越大。
2.2 單因素方差分析的使用前提
獨立性:不滿足獨立性會有很大的影響,因為信息存在“重疊”的部分
疑問:在哪兒可以驗證?卡方檢驗?卡方檢驗檢驗的是兩個分類變量
正態(tài)性:對正態(tài)性的要求是穩(wěn)健的
方差齊性:檢驗方法除了Levene’s檢驗,還可以有其他的檢驗方法:Bartleet法(比較各組方差的加權(quán)算數(shù)平均數(shù)和幾何均數(shù))、Hartley法(樣本量相同時使用)、Cochran法(樣本量相同時使用)。
方差分析對變量的類型有要求嗎?應(yīng)該分析的都是連續(xù)變量
2.3 單因素方法分析的使用前提不滿足時變換方法
對數(shù)變換、平方根變換、平方根反正弦變換、平方變換、倒數(shù)變換、Box-Cox變換(分段函數(shù))
2.4 單因素方差分析的適用場景
T檢驗只能檢驗兩組樣本的均數(shù)差,多組樣本的時候就需采用方差分析;
操作:打開分析—比較均值—均值 進行預(yù)分析,可以大致看出各均值是否相同,方差是否齊性;再進行 打開 分析—比較均值—單因素anova;
適用場景:均數(shù)間的多重比較(全部兩兩比較)、各組均數(shù)的精細比較(可以指定要比較的兩個組,通過設(shè)定系數(shù))、組間均數(shù)的趨勢檢驗(為了利用分組變量中體現(xiàn)出的次序信息,目的不是為了擬合線性或非線性的模型,而是希望知道因素的水平改變時均數(shù)的變化趨勢)
2.5 方差分析結(jié)束后如均值不同可進行兩兩比較(事前比較、事后比較)
LSD法:用于事先計劃好的比較,最靈敏;檢驗水準沒有校正,每次都是α
Sidak法:第二靈敏;
Bonferroni法:用于事先計劃好的比較,第三靈敏;
Scheffe法:多用樣本含量不等的情況,第四靈敏;
Dunnett法:常用于多個實驗組和一個對照組的比較,第五靈敏;
尋找同質(zhì)亞組的檢驗方法:
S-N-K法:將所有樣本分為多個子集;
Tukey法:任意兩組比較,要求樣本含量相同,MEER不超過α;
Duncan法:與SNK法類似;
備注:
CER:每進行一次比較犯一類錯誤錯誤的概率;
EERC:完全無效假設(shè)檢驗下,做完全部比較犯一類錯誤的概率;
MEER:部分或者任何完全假設(shè)下,犯一類錯誤的最大概率值,即最大實驗誤差率。
疑問:單因素方差分析的事前檢驗和事后檢驗有什么區(qū)別,為什么結(jié)果不同??
三、非參數(shù)檢驗
3.1 非參數(shù)檢驗的基本思想
非參數(shù)檢驗的意思是指整個推斷過程和結(jié)論均和原總體參數(shù)無關(guān),而不是不利用參數(shù)
3.2 非參數(shù)檢驗的優(yōu)勢
穩(wěn)健性;
對數(shù)據(jù)的測量尺度、數(shù)據(jù)類型無約束;
適用于小樣本、無分布樣本、數(shù)據(jù)污染樣本、混雜樣本等;
3.3 非參數(shù)檢驗使用前提
有序、名義變量,這類數(shù)據(jù)的分布形態(tài)一般未知,均值方差等數(shù)據(jù)無意義;
樣本分布未知;
樣本數(shù)據(jù)不滿足正態(tài)分布,即便是經(jīng)過變量變換;
方差齊性不滿足,即便是經(jīng)過變量變換;
總體分布正態(tài),連續(xù)變量,但樣本容量極小,如10以下;
3.2 非參數(shù)檢驗適用情形
單樣本非參數(shù)檢驗
K-S檢驗:針對連續(xù)變量,考察是否符合正態(tài)分布
操作:打開–分析–非參數(shù)檢驗–單樣本
二項分布檢驗:針對兩分類變量,考察是否符合二項分布
操作:打開–分析–非參數(shù)檢驗–單樣本
游程檢驗:考察總體的隨機性
操作:打開–分析–非參數(shù)檢驗–單樣本
兩個獨立樣本的非參數(shù)檢驗(無效假設(shè)為兩樣本的中心位置是否相等)
Mann-Whitney U檢驗,兩樣本秩和檢驗,應(yīng)用范圍最廣;
Kolmogorov-Smirnov Z檢驗:檢驗兩個樣本的累積頻數(shù)分布曲線,判斷兩個樣本的分布是否相同;
Moses Extreme Reactions 檢驗:Moses極端反應(yīng)檢驗,單側(cè)檢驗
Wald-Wolfowitz Runs 檢驗:單側(cè)檢驗,無論是集中趨勢、離散趨勢、偏度的波動情況都能檢測出來,如果只是檢查中心位置,最好不用,檢驗兩樣本是否來自同樣的分布;
操作:打開 分析—非參數(shù)檢驗—獨立樣本
多個獨立樣本的非參數(shù)檢驗
Kruskal-Wallis H檢驗(類似Wilcoxon符號秩檢驗,兩樣本在多樣本上的推廣)
中位數(shù)檢驗
Jonckheere-Terpstra檢驗:對連續(xù)變量和有序分類資料都使用,分組變量為有序分類資料時,檢驗效能要高于Kruskal-Wallis H檢驗
操作:打開 分析—非參數(shù)檢驗—獨立樣本
兩個配對樣本(求出差值,查看中位數(shù)是否為0,目的就是為了檢驗均值是否相等)
sign符號檢驗:只利用了符號信息,差值是否一半為正一半為負;
Wilcoxon符號秩檢驗:利用了符號和差值的大小順序(符號+秩序)
操作:打開 分析—非參數(shù)檢驗—相關(guān)樣本
多個相關(guān)樣本非參數(shù)檢驗
Friedman 檢驗:基本思想是同區(qū)組的處理值和計算的秩比較才有意義,還附帶齊性子集結(jié)果給出了準確的兩兩比較信息;
Kendall協(xié)和系數(shù)檢驗:為了檢驗各組評價是否一致,F(xiàn)riedman檢驗只能說明尚不能認為有差異,但是無法評判一致性,Kendall方法針對連續(xù)變量,
Cochran檢驗:有些評價只能用是否、好壞等二元數(shù)據(jù)來判斷,Cochran只適用于二分類變量,用Kendall方法會有很多的打結(jié)現(xiàn)象。
操作:打開 分析–非參數(shù)檢驗–相關(guān)樣本
通用方法—秩變換分析方法
前面有關(guān)秩的分析方法其實都是秩變換方法的不同應(yīng)用,分析方法中可以直接將秩求出后再進行分析。
操作:轉(zhuǎn)換 — 個案排秩(也可以指定生成符合正態(tài)分布的秩)
四、卡方檢驗
4.1 卡方檢驗的基本思想
以卡方分布為基礎(chǔ),計算觀察值和期望值之間的偏離程度;
4.2 卡方檢驗的使用前提
最小期望頻數(shù)均大于1
至少4/5的單元格期望頻數(shù)大于5
計算時如果單元格期望頻數(shù)小于5要和其他種類合并
樣本觀察值量超過50
4.3 卡方檢驗的使用目的
考察無序分類變量各水平在兩組或多組間的分布是否一致;
檢驗?zāi)硞€連續(xù)變量的分布是否和理論分布一致;
分類變量的概率是否等于指定概率;
檢驗兩個分類變量是否獨立;
檢驗控制了其中幾個因素后,剩余的兩個分類變量是否獨立;
檢驗兩種方法的結(jié)果是否一致;
4.4 卡方檢驗的適用場景
單樣本卡方檢驗
操作: 打開 分析–非參數(shù)檢驗–單樣本
兩樣本卡方檢驗
操作: 打開 分析–描述統(tǒng)計–交叉表
兩分類變量間關(guān)聯(lián)程度的度量:定性描述兩個分類變量是否存在關(guān)聯(lián)(更為詳細的可以根據(jù)相關(guān)分析)
操作: 打開 分析–描述統(tǒng)計–交叉表
Kappa一致性檢驗(用于配對樣本,如兩個人針對一個事物的評價)
用于配對樣本的檢驗,Kappa檢驗的結(jié)果是兩個人的評價是否是相關(guān)的
操作: 打開 分析–描述統(tǒng)計–交叉表
Mcnemar 配對卡方檢驗
Kappa檢驗只能看出兩者是否有關(guān)聯(lián),但是不能判斷是否一致,Mcnemar 配對卡方檢驗就可以解決兩者是否一致的問題
操作: 打開 分析–描述統(tǒng)計–交叉表
分層卡方檢驗
可以控制一個因素,如收入對車輛購買率的影響,可以將城市作為分層因素,從而可以得到更準確的結(jié)果,但是SPSS中只能進行兩分類變量的檢驗,不能進行多分類的檢驗,且分層因素和要分析的因素之間如果存在交互關(guān)系也不能進行檢驗。
操作: 打開 分析–描述統(tǒng)計–交叉表
4.5 備注
相對危險度(RR)
RR=試驗人群反應(yīng)陽性的概率/對照組人群反應(yīng)陽性的概率
RR=1,說明試驗因素反應(yīng)陽性沒有關(guān)聯(lián)
RR<1,說明試驗因素導(dǎo)致反應(yīng)陽性的發(fā)生率降低
RR>1,說明試驗因素導(dǎo)致反應(yīng)陽性的發(fā)生率升高
優(yōu)勢比(OR)
OR=(反應(yīng)陽性組中實驗因素陽性人數(shù)/反應(yīng)陽性組中實驗因素陰性人數(shù))/(反應(yīng)陰性組中實驗因素陽性人數(shù)/反應(yīng)陰性組中實驗因素陰性人數(shù))
OR>1,說明該試驗因素更容易導(dǎo)致實驗結(jié)果為陽性
推薦學(xué)習(xí)書籍
《CDA一級教材》適合CDA一級考生備考,也適合業(yè)務(wù)及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計已有10萬+在讀~
免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10CDA 數(shù)據(jù)分析師:商業(yè)數(shù)據(jù)分析實踐的落地者與價值創(chuàng)造者 商業(yè)數(shù)據(jù)分析的價值,最終要在 “實踐” 中體現(xiàn) —— 脫離業(yè)務(wù)場景的分 ...
2025-09-10機器學(xué)習(xí)解決實際問題的核心關(guān)鍵:從業(yè)務(wù)到落地的全流程解析 在人工智能技術(shù)落地的浪潮中,機器學(xué)習(xí)作為核心工具,已廣泛應(yīng)用于 ...
2025-09-09SPSS 編碼狀態(tài)區(qū)域中 Unicode 的功能與價值解析 在 SPSS(Statistical Product and Service Solutions,統(tǒng)計產(chǎn)品與服務(wù)解決方案 ...
2025-09-09