
在spss統(tǒng)計分析中,方差分析在比較均值菜單和一般線性模型菜單中都可以做,單因素方差分析一般稱為單因素Anova分析,單變量方差分析一般稱為一般線性模型單變量分析。這兩種方法既有區(qū)別又有聯(lián)系,在統(tǒng)計學(xué)中,這兩種分析方法統(tǒng)稱為方差分析,在spss中由于線性模型的引入,才有所區(qū)分,那么這兩種分析方法在具體應(yīng)用中有什么樣的區(qū)別和聯(lián)系?二者的適用情況是什么?分析結(jié)果有何異同?下面將進行詳細介紹。
【基本概念】
方差分析(analysisof variance,Anova)是對總體均值的比較,其目的是檢驗平均值之間的差異是否具有統(tǒng)計學(xué)意義。
單因素方差分析(One-wayAnova),是檢驗由單一因素影響的多組樣本某因變量的均值是否有顯著差異。與之對應(yīng)的是多因素方差分析,需要說明的是:這里的單因素與多因素是針對自變量而言的,因變量可以有多個,但只有一個自變量(spss里稱為因子)。
單變量方差分析:即單因變量方差分析,單變量對應(yīng)的英文名稱為“univariate”,其實際含義是“只有一個因變量的方差分析模型”,是檢驗幾個分類變量對單個因變量均值的影響。與之相對應(yīng)的是多變量方差分析。需要說明的是:這里的自變量(spss里稱為因子,又包括固定因子和隨機因子)可以有多個,但只有一個因變量。
【SPSS實現(xiàn)】
案例分析
某公司生產(chǎn)某種新食品,在不同區(qū)域內(nèi)隨機選取不同規(guī)模的超市,進行銷售(具體數(shù)據(jù)見下圖),要求分析超市規(guī)模對該產(chǎn)品銷量的影響;
分析思路
案例中有兩個自變量即超市規(guī)模(大、中、小,分別用1,2,3表示)和超市區(qū)位(市區(qū)、鄉(xiāng)下,分別用1,2表示);兩個因變量,即產(chǎn)品銷量和客流量。如果要研究超市規(guī)模對產(chǎn)品銷量的影響,那么這里的自變量就只有一個,即超市規(guī)模(三種水平,大、中、小),因變量也只有一個,即產(chǎn)品銷量。因此,本例可以使用單因素方差分析法,也可以使用單變量方差分析法。
我們同時采用這兩種方法進行分析,對比一下這兩種分析方法的結(jié)果有何異同。
分析步驟
一:單因素方差分析具體步驟:
1.選擇菜單【分析】-【比較均值】-【單因素Anova】,在彈出的對話框中進行如下選擇:把【產(chǎn)品銷量】選入因變量列表框,把【超市規(guī)?!窟x入因子列表框。從這里可以看出,因變量列表框是可以選擇多個因變量的,但是因子列表框中,只能選擇一個變量。
2.然后,在右側(cè)選擇【事后多重比較】菜單,進行如下操作:勾選【LSD】、【SNK】、【Bonferroni】、【Tukey】、【Duncan】復(fù)選框,單擊【繼續(xù)】按鈕,返回主對話框。(方法的選擇主要依據(jù)想要何種多重比較結(jié)果,一般以選擇LSD\TUKEY\SNK\SCHEFFE居多,Bonferroni法是對LSD法的改進,這里為了進行不同方法間的比較,故選以上方法)。此對話框?qū)?yīng)的是均值的多重比較,主要分為假定方差齊性和未假定方差齊性兩類,基本上只使用假定方差齊性,因為如果方差不齊性,不建議做方差分析或進行兩兩比較。
3.在右側(cè)選擇【選項】菜單,依次勾選【描述性】、【方差同質(zhì)性檢驗】、【平均值圖】,其他默認,單擊【繼續(xù)】按鈕,返回主對話框。其中方差同質(zhì)性檢驗即方差齊性檢驗,不同規(guī)模超市之間的產(chǎn)品銷量的方差是否齊性。因為方差齊性與否直接決定著進行多重比較時的方法選擇。
4.單擊【確定】按鈕,輸出結(jié)果。
二:單變量方差分析具體步驟:
1.選擇菜單【分析】-【一般線性模型】-【單變量】,在彈出的對話框中進行如下選擇:把【產(chǎn)品銷量】選入因變量列表框,把【超市規(guī)?!窟x入固定因子列表框。需要注意的是:這里的【因變量】列表框只能選擇一個變量,【固定因子】、【隨機因子】列表框可以選擇多個變量。
從對話框可以看出單變量方差分析與單因素方差分析的差別:一般線性模型單變量方差分析的因子區(qū)分為固定因子和隨機因子,比單因素Anova分析更為細致,而且固定因子列表框可以同時選入多個變量,單因素Anova分析,因子列表框只能選入一個變量。
2.在主對話框界面選擇右側(cè)【模型】菜單,選擇默認【全因子】,【類型Ⅲ】,單擊【繼續(xù)】按鈕返回主對話框
3.在主對話框界面右側(cè)選擇【事后多重比較】菜單,把【超市規(guī)?!窟x入【事后檢驗】列表框,同樣勾選【LSD】、【SNK】、【Bonferroni】、【Tukey】、【Duncan】復(fù)選框,單擊【繼續(xù)】按鈕,返回主對話框。該對話框與單因素Anova對話框類似,但不同的是這里可以自由選入因子。
4.在主對話框界面右側(cè)選擇【選項】菜單,在【輸出】欄,勾選【描述性統(tǒng)計】【同質(zhì)性檢驗】、【殘差圖】復(fù)選框,單擊【繼續(xù)】按鈕返回主對話框
5.單擊【確定】按鈕,輸出結(jié)果。
結(jié)果解釋
【單因素Anova分析結(jié)果解釋】
1.描述性統(tǒng)計結(jié)果
下圖輸出了基本的樣本量、平均值、標準差等描述性統(tǒng)計結(jié)果??芍^大規(guī)模超市的平均銷量是最高的,但這只是針對該樣本的,其所在總體是否也如此,需要進行后續(xù)分析。
2.方差同質(zhì)性檢驗結(jié)果
下圖輸出了方差同質(zhì)性檢驗結(jié)果,方差同質(zhì)性檢驗采用的是levene檢驗,檢驗3種超市規(guī)模之間的方差是否齊性,由表中顯著性=0.165>0.05可知,接受原假設(shè),認為3種超市規(guī)模之間方差相等。
3.方差分析結(jié)果
方差分析采用的是F檢驗,表中,平方和表示離差平方和,也就是變異,分為組間變異、組內(nèi)變異。Df為自由度,均方為離差平方和/自由度,F(xiàn)統(tǒng)計量=組間均方/組內(nèi)均方。其顯著性=0.042<0.05,故拒絕原假設(shè),認為不同超市規(guī)模之間的均值具有顯著差異(由于顯著性=0.042,說明是弱顯著性)。具體是哪種規(guī)模之間有均值有顯著差異,故需要再進一步做多重比較分析。
4.事后檢驗結(jié)果
下圖輸出了【LSD】、【Bonferroni】、【Tukey】法的分析結(jié)果,可以看出,規(guī)模較大超市與較小超市之間差異顯著,中等規(guī)模超市與較大規(guī)模超市和較小規(guī)模超市之前均不存在顯著差異。三種比較方法的結(jié)果一致。
5.同類子集
下圖為同類子集輸出結(jié)果,Student-Newman-Keuls,Tukey,Duncan(D)三種方法的思想,都是在樣本中尋找同質(zhì)的組,認為同組的水平?jīng)]有差異,從結(jié)果可以看出,三種方法都把規(guī)模分為兩組,小中一組,中大一組,因此可以排除中等規(guī)模的影響,認為較小規(guī)模與較大規(guī)模之間均值存在顯著差異。
5.平均值圖
從3種規(guī)模超市之間的銷量均值圖也可以看出三種規(guī)模之間的差異。
【一般線性模型單變量結(jié)果解釋】
1.描述統(tǒng)計結(jié)果
同樣輸出了三種規(guī)模超市的平均值、標準差、樣本量等情況,可以看出較大規(guī)模超市的平均銷量較高,同時其標準差也較大。
2.方差齊性檢驗
由下圖可以看出,顯著性=0.165>0.05,與單因素Anova分析結(jié)果一致,不能拒絕原假設(shè),認為三種水平的方差相等。
a.設(shè)計:截距+超市規(guī)模
3.方差分析結(jié)果
第1行,校正的模型,是對整個方差分析模型的檢驗,原假設(shè)為模型中所有因素對因變量無影響,即μ=0,此處p<0.05,即均值不等于0,拒絕原假設(shè),即認為超市規(guī)模對產(chǎn)品銷量有影響。
第2行,截距,原假設(shè)為不考慮自變量影響時,因變量的均值為0,此處P<0.05,拒絕原假設(shè)。
第3行,超市規(guī)模,也就是對自變量的檢驗即組間變異,原假設(shè)為自變量對因變量沒有影響,此處P<0.05,拒絕原假設(shè)??梢钥闯龃颂幍慕Y(jié)果同第1行的結(jié)果是相同的,這是因為案例只涉及到單一變量(產(chǎn)品銷量)的比較。
第4行,錯誤即誤差
第5行,總計=截距+組間+誤差
第6行,校正=組間+誤差
4.事后檢驗
同樣,下圖輸出了【LSD】、【Bonferroni】、【Tukey】法的分析結(jié)果,可以看出,規(guī)模較大超市與較小超市之間差異顯著,中等規(guī)模超市與較大規(guī)模超市和較小規(guī)模超市之前均不存在顯著差異,三種比較方法的結(jié)果一致。該結(jié)果與單因素Anova方法一致。
5.均一子集
下圖為均一子集輸出結(jié)果,Student-Newman-Keuls,Tukey,Duncan(D)三種方法的分析結(jié)果與單因素Anova分析結(jié)果一致。
【總結(jié)】
單因素方差分析和單變量方差分析的區(qū)別主要體現(xiàn)在在前者是單個自變量,后者是單個因變量。在實際運用中,這兩種方法的統(tǒng)計效能是等價的,一般不做特別嚴格的區(qū)分,只是一般線性模型比單因素在某些方面更為細致一些。
在適用條件上,二者的條件相同,均為:獨立性、正態(tài)性、方差齊性。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10