
方差齊性檢驗(yàn)的原理
統(tǒng)計(jì)學(xué)搜索整理匯總——方差齊性檢驗(yàn)的原理
LXK的結(jié)論:齊性檢驗(yàn)時(shí)F越?。╬越大),就證明沒有差異,就說明齊,比如F=1.27,p>0.05則齊,這與方差分析均數(shù)時(shí)F越大約好相反。[www.NiUBB.nET]
LXK注:方差(MS或s2)=離均差平方和/自由度(即離均差平方和的均數(shù))
標(biāo)準(zhǔn)差=方差的平方根(s)
F=MS組間/MS誤差=(處理因素的影響+個(gè)體差異帶來的誤差)/個(gè)體差異帶來的誤差
=================
F檢驗(yàn)為什么要求各比較組的方差齊性?
——之所以需要這些前提條件,是因?yàn)楸仨氃谶@樣的前提下所計(jì)算出的t統(tǒng)計(jì)量才服從t分布,而t檢驗(yàn)正是以t分布作為其理論依據(jù)的檢驗(yàn)方法。
在方差分析的F檢驗(yàn)中,是以各個(gè)實(shí)驗(yàn)組內(nèi)總體方差齊性為前提的,因此,按理應(yīng)該在方差分析之前,要對各個(gè)實(shí)驗(yàn)組內(nèi)的總體方差先進(jìn)行齊性檢驗(yàn)。如果各個(gè)實(shí)驗(yàn)組內(nèi)總體方差為齊性,而且經(jīng)過F檢驗(yàn)所得多個(gè)樣本所屬總體平均數(shù)差異顯著,這時(shí)才可以將多個(gè)樣本所屬總體平均數(shù)的差異歸因于各種實(shí)驗(yàn)處理的不同所致;如果各個(gè)總體方差不齊,那么經(jīng)過F檢驗(yàn)所得多個(gè)樣本所屬總體平均數(shù)差異顯著的結(jié)果,可能有一部分歸因于各個(gè)實(shí)驗(yàn)組內(nèi)總體方差不同所致。
簡單地說就是在進(jìn)行兩組或多組數(shù)據(jù)進(jìn)行比較時(shí),先要使各組數(shù)據(jù)符合正態(tài)分布,另外就是要使各組數(shù)據(jù)的方差相等(齊性)。
-----------------
在SPSS中,如果進(jìn)行方差齊性檢驗(yàn)?zāi)??命令是什么?
方差分析(Anaylsis of Variance, ANOVA)要求各組方差整齊,不過一般認(rèn)為,如果各組人數(shù)相若,就算未能通過方差整齊檢驗(yàn),問題也不大。
One-Way ANOVA對話方塊中,點(diǎn)擊Options?(選項(xiàng)?)按扭,
勾Homogeneity-of-variance即可。它會(huì)產(chǎn)生Levene、Cochran C、Bartlett-Box F等檢驗(yàn)值及其顯著性水平P值,若P值<于0.05,便拒絕方差整齊的假設(shè)。
順帶一提,Cochran和Bartlett檢定對非正態(tài)性相當(dāng)敏感,
若出現(xiàn)「拒絕方差整齊」的檢測結(jié)果,或因這原因而做成。
---------------
用spss處理完數(shù)據(jù)的顯示結(jié)果中,F(xiàn)值,t值及其顯著性(sig)都分別是解釋什么的? 答案
一般而言,為了確定從樣本(sample)統(tǒng)計(jì)結(jié)果推論至總體時(shí)所犯錯(cuò)的概率,我們會(huì)利用統(tǒng)計(jì)學(xué)家所開發(fā)的一些統(tǒng)計(jì)方法,進(jìn)行統(tǒng)計(jì)檢定。
通過把所得到的統(tǒng)計(jì)檢定值,與統(tǒng)計(jì)學(xué)家建立了一些隨機(jī)變量的概率分布(probability distribution)進(jìn)行比較,我們可以知道在多少%的機(jī)會(huì)下會(huì)得到目前的結(jié)果。倘若經(jīng)比較后發(fā)現(xiàn),出現(xiàn)這結(jié)果的機(jī)率很少,亦即是說,是在機(jī)會(huì)很少、很罕有的情況下才出現(xiàn);那我們便可以有信心的說,這不是巧合,是具有統(tǒng)計(jì)學(xué)上的意義的(用統(tǒng)計(jì)學(xué)的話講,就是能夠拒絕 1
虛無假設(shè)null hypothesis,Ho)。[wwW.Niubb.nEt]相反,若比較后發(fā)現(xiàn),出現(xiàn)的機(jī)率很高,并不罕見;那我們便不能很有信心的直指這不是巧合,也許是巧合,也許不是,但我們沒能確定。
F值和t值就是這些統(tǒng)計(jì)檢定值,與它們相對應(yīng)的概率分布,就是F分布和t分布。統(tǒng)計(jì)顯著性(sig)就是出現(xiàn)目前樣本這結(jié)果的機(jī)率。
至於具體要檢定的內(nèi)容,須看你是在做哪一個(gè)統(tǒng)計(jì)程序。
舉一個(gè)例子,
比如,你要檢驗(yàn)兩獨(dú)立樣本均數(shù)差異是否能推論至總體,而行的t檢驗(yàn)。
兩樣本(如某班男生和女生)某變量(如身高)的均數(shù)并不相同,
但這差別是否能推論至總體,代表總體的情況也是存在著差異呢?
會(huì)不會(huì)總體中男女生根本沒有差別,只不過是你那麼巧抽到這2樣本的數(shù)值不同? 為此,我們進(jìn)行t檢定,算出一個(gè)t檢定值,
與統(tǒng)計(jì)學(xué)家建立的以「總體中沒差別」作基礎(chǔ)的隨機(jī)變量t分布進(jìn)行比較,
看看在多少%的機(jī)會(huì)(亦即顯著性sig值)下會(huì)得到目前的結(jié)果。
若顯著性sig值很少,比如<0.05(少於5%機(jī)率),
亦即是說,「如果」總體「真的」沒有差別,那麼就
只有在機(jī)會(huì)很少(5%)、很罕有的情況下,才會(huì)出現(xiàn)目前這樣本的情況。
雖然還是有5%機(jī)會(huì)出錯(cuò),但我們還是可以「比較有信心」的說:
目前樣本中這情況(男女生出現(xiàn)差異的情況)不是巧合,是具統(tǒng)計(jì)學(xué)意義的,
「總體中男女生不存差異」的虛無假設(shè)應(yīng)予拒絕,簡言之,總體應(yīng)該存在著差異。
每一種統(tǒng)計(jì)方法的檢定的內(nèi)容都不相同,
同樣是t-檢定,可能是上述的檢定總體中是否存在差異,
也同能是檢定總體中的單一值是否等於0或者等於某一個(gè)數(shù)值。
至於F-檢定,方差分析(或譯變異數(shù)分析,Analysis of Variance),
它的原理大致也是上面說的,但它是透過檢視變量的方差而進(jìn)行的。
它主要用于:均數(shù)差別的顯著性檢驗(yàn)、分離各有關(guān)因素并估計(jì)其對總變異的作用、分析因素間的交互作用、方差齊性(Equality of Variances)檢驗(yàn)等情況。
----------
方差齊性檢驗(yàn)在什么情況下進(jìn)行?為什么要進(jìn)行方差齊性檢驗(yàn)?
如果需要進(jìn)行方差分析,就要進(jìn)行方差齊性檢驗(yàn),即若組間方差不齊則不適用方差分析。但可通過對數(shù)變換、平方根變換、倒數(shù)變換、平方根反正弦變換等方法變換后再進(jìn)行方差齊性檢驗(yàn),若還不行只能進(jìn)行非參數(shù)檢驗(yàn).
除了對兩個(gè)研究總體的總體平均數(shù)的差異進(jìn)行顯著性檢驗(yàn)以外,我們還需要對兩個(gè)獨(dú)立樣本所屬總體的總體方差的差異進(jìn)行顯著性檢驗(yàn),統(tǒng)計(jì)學(xué)上稱為方差齊性(相等)檢驗(yàn)。
方差齊性實(shí)際上是指要比較的兩組數(shù)據(jù)的分布是否一致,通俗的來說就是兩者是否適合比較
為什么要做方差齊性和正態(tài)檢驗(yàn)?
在做方差分析時(shí),為什么要做方差齊性和正態(tài)檢驗(yàn)?目的是什么?
主要是確認(rèn)數(shù)據(jù)的合理性(不具備相關(guān)性)而已。
正態(tài)分布以及近似正態(tài)分布是應(yīng)用該分析的基本條件??
構(gòu)造的統(tǒng)計(jì)量需要樣本有正態(tài)等方差的條件,
或者說是這樣的條件情況下的一種判斷,
失去了這個(gè)前提,后期的判斷分析都是空中樓閣。
就像討論如何成為一個(gè)好男人,那么前提他必須是一個(gè)男人
而且方差齊性檢驗(yàn)的Bartlett方法也是以正太分布為前提的,
其所構(gòu)造的卡方統(tǒng)計(jì)量必須滿足樣本為正態(tài)分布。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10