
SPSS統(tǒng)計分析:多因素方差分析及案例
多因素方差分析,用于研究一個因變量是否受到多個自變量(也稱為因素)的影響,它檢驗多個因素取值水平的不同組合之間,因變量的均值之間是否存在顯著的差異。多因素方差分析既可以分析單個因素的作用(主效應),也可以分析因素之間的交互作用(交互效應),還可以進行協(xié)方差分析,以及各個因素變量與協(xié)變量的交互作用。
根據(jù)觀測變量(即因變量)的數(shù)目,可以把多因素方差分析分為:單變量多因素方差分析(也叫一元多因素方差分析)與多變量多因素方差分析(即多元多因素方差分析)。本文將重點講述一元多因素方差分析,下篇文章將詳細講述多元多因素方差分析。
一元多因素方差分析:只有一個因變量,考察多個自變量對該因變量的影響。例如:分析不同品種、不同施肥量對農(nóng)作物產(chǎn)量的影響時,可將農(nóng)作物產(chǎn)量作為觀測變量,品種和施肥量作為控制變量。利用多因素方差分析方法,研究不同品種、不同施肥量是如何影響農(nóng)作物產(chǎn)量的,并進一步研究哪種品種與哪種水平的施肥量是提高農(nóng)作物產(chǎn)量的最優(yōu)組合。
分析原理
通過計算F統(tǒng)計量,進行F檢驗。F統(tǒng)計量是平均組間平方和與平均組內(nèi)平方和的比。
這里,把總的影響平方和記為SST,它分為兩個部分,一部分是由控制變量引起的離差,記為SSA(組間離差平方和),另一部分是由隨機變量引起的SSE(組內(nèi)離差平方和)。即SST=SSA+SSE。組間離差平方和SSA是各水平均值和總體均值離差的平方和,反映了控制變量的影響。組內(nèi)離差平方和是每個數(shù)據(jù)與本水平組平均值離差的平方和,反映了數(shù)據(jù)抽樣誤差的大小程度。
通過F值看出,如果控制變量的不同水平對觀測變量有顯著影響,那觀測變量的組間離差平方和就大,F(xiàn)值也大;相反,如果控制變量的不同水平?jīng)]有對觀測變量造成顯著影響,那組內(nèi)離差平方和就比較大,F(xiàn)值就比較小。
同時,SPSS還會依據(jù)F分布表給出相應的相伴概率值sig。如果sig小于顯著性水平(一般顯著性水平設為0.05、0.01、或者0.001),則認為控制變量不同水平下各總體均值有顯著差異,反之,則不然。一般地,F(xiàn)值越大,則sig值越小。
SPSS分析案例
現(xiàn)在有一個公司員工的工資表,想看一下員工性別“gender”與接受教育年限“edu”這兩個控制變量對員工“當前工資”的影響。采用多因素方差分析法,則要分別考慮“gender”、“edu”對“當前工資”的影響,稱為主效應,還要考慮“gender*edu”對“當前工資”的影響,稱為交互效應。
(1)分析步驟:將數(shù)據(jù)導入SPSS后,選擇:分析—— 一般線性模型——單變量
(2)將“當前工資”選入因變量(也就是觀測變量),將性別“gender”與受教育年限“edu”選入固定因子(也就是控制變量)。
(3)選擇“單變量”的“模型”,打開對話框后選擇“全因子”,表示方差分析的模型包括所有因素的主效應,也包括因素之間的交互效應。然后“繼續(xù)”。
(4)打開“單變量”的“繪制”對話框,選擇“gender”為橫軸變量,選擇“edu”為分線變量,單擊“添加”,即顯示這兩個因素變量的交互作用,即 “gender*edu”這個交互作用變量。由于此例中“gender”只有兩個水平,即男、女;而“edu”有多種水平。因此,如果主效應顯著,則表明因素兩種或多種水平之間存在顯著性差異。事后可以繼續(xù)對同一因素多個水平之間的均值差異進行比較,該過程稱為多重比較。
但實際上如果主效應和交互效應都達到顯著,我們更關(guān)心在多因素交互作用下,因變量有什么影響。
因此,如果交互效應顯著的話,通常需要進行簡單效應檢驗。所謂簡單效應檢驗,是指一個因素的水平在另一個因素的某個因素的某個水平上的變異。例如我們本例中的,如果gender與edu之間存在顯著的交互作用,我們可以檢驗當gender為“女”時,edu的各個水平之間的差異,稱為edu在“女”性水平上的簡單效應;以及在“男”性水平上edu各水平之間的差異,稱為edu在“男”性水平上的簡單效應。簡單效應檢驗,實際上是把其中一個自變量固定在某一個特定的水平上,考察另一個自變量對因變量的影響。簡單效應檢驗在SPSS里是用一個“MANOVA”命令來實現(xiàn)的。同理,當我們檢驗三個自變量時,若這些自變量之間的交互作用顯著,需要進行簡單簡單效應檢驗,即一個因素的水平在另外兩個因素的水平結(jié)合上的效應。也就是把兩個因素固定在各自的某一個水平上,考察第三個因素對因變量的影響。也是用“MANOVA”命令來實現(xiàn)的。我們觀察簡單效應顯著與否,是通過F值與sig值來看的,一般用sig值與我們設定的一個數(shù)值(0.05、0.01、或者0.001)來比較,若sig值大于該數(shù)值,說明簡單效應不顯著;反之,若sig值小于該數(shù)值,說明簡單效應顯著。
(5)打開“選項”對話框,將左邊三個控制變量均移入右邊,“顯示均值”,同時選中“描述統(tǒng)計”,選中“比較主效應”。
(6)點擊“確定”以后,就會在SPSS查看器里顯示出結(jié)果。其中,最上面的那部分代碼是我們所做的操作在SPSS里具體實現(xiàn)的步驟的代碼。下面的表格是我們想要的結(jié)果,從表格里得出結(jié)論。
(7)從下面的“主體間效應的檢驗”表格里,我們比較性別gender、受教育程度edu、及gender*edu交互作用的F值及sig值,看到edu的F值最大,sig值最小,且sig<0.05。而gender與gender*edu的sig值都大于0.05,得出結(jié)論:“gender”的主效應未達到顯著,而“edu”的主效應達到顯著,gender與edu的交互效應未達到顯著(當交互效應達到顯著時,進而可以進行簡單效應檢驗結(jié)果),就不需要進行簡單效應檢驗。則該公司員工“受教育程度”對員工“當前工資”的影響顯著,而“性別”對“當前工資”的影響不明顯。
(8)下圖為均值分布圖,即為兩因素edu與gender作用下,因變量員工工資的均值分布情況。通常,若交互效應不顯著時,圖中的因素分布線均為平行線;若交互效應顯著,圖中的因素分線不平行。此圖中,將性別“gender”作為橫軸變量,觀察接受教育年限“edu”對因變量“當前工資”的影響。
圖中得出結(jié)論:當受教育年限為20年,一般為研究生水平的時候,男女工資差別不大;受教育年限為14年,一般為??粕?,男女工資差別不明顯。但當受教育年限為8年、17年的時候,男女工資差別尤其明顯。
推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業(yè)務及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計已有10萬+在讀~
免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10