
SPSS統(tǒng)計分析:多因素方差分析及案例
多因素方差分析,用于研究一個因變量是否受到多個自變量(也稱為因素)的影響,它檢驗(yàn)多個因素取值水平的不同組合之間,因變量的均值之間是否存在顯著的差異。多因素方差分析既可以分析單個因素的作用(主效應(yīng)),也可以分析因素之間的交互作用(交互效應(yīng)),還可以進(jìn)行協(xié)方差分析,以及各個因素變量與協(xié)變量的交互作用。
根據(jù)觀測變量(即因變量)的數(shù)目,可以把多因素方差分析分為:單變量多因素方差分析(也叫一元多因素方差分析)與多變量多因素方差分析(即多元多因素方差分析)。本文將重點(diǎn)講述一元多因素方差分析,下篇文章將詳細(xì)講述多元多因素方差分析。
一元多因素方差分析:只有一個因變量,考察多個自變量對該因變量的影響。例如:分析不同品種、不同施肥量對農(nóng)作物產(chǎn)量的影響時,可將農(nóng)作物產(chǎn)量作為觀測變量,品種和施肥量作為控制變量。利用多因素方差分析方法,研究不同品種、不同施肥量是如何影響農(nóng)作物產(chǎn)量的,并進(jìn)一步研究哪種品種與哪種水平的施肥量是提高農(nóng)作物產(chǎn)量的最優(yōu)組合。
分析原理
通過計算F統(tǒng)計量,進(jìn)行F檢驗(yàn)。F統(tǒng)計量是平均組間平方和與平均組內(nèi)平方和的比。
這里,把總的影響平方和記為SST,它分為兩個部分,一部分是由控制變量引起的離差,記為SSA(組間離差平方和),另一部分是由隨機(jī)變量引起的SSE(組內(nèi)離差平方和)。即SST=SSA+SSE。組間離差平方和SSA是各水平均值和總體均值離差的平方和,反映了控制變量的影響。組內(nèi)離差平方和是每個數(shù)據(jù)與本水平組平均值離差的平方和,反映了數(shù)據(jù)抽樣誤差的大小程度。
通過F值看出,如果控制變量的不同水平對觀測變量有顯著影響,那觀測變量的組間離差平方和就大,F(xiàn)值也大;相反,如果控制變量的不同水平?jīng)]有對觀測變量造成顯著影響,那組內(nèi)離差平方和就比較大,F(xiàn)值就比較小。
同時,SPSS還會依據(jù)F分布表給出相應(yīng)的相伴概率值sig。如果sig小于顯著性水平(一般顯著性水平設(shè)為0.05、0.01、或者0.001),則認(rèn)為控制變量不同水平下各總體均值有顯著差異,反之,則不然。一般地,F(xiàn)值越大,則sig值越小。
SPSS分析案例
現(xiàn)在有一個公司員工的工資表,想看一下員工性別“gender”與接受教育年限“edu”這兩個控制變量對員工“當(dāng)前工資”的影響。采用多因素方差分析法,則要分別考慮“gender”、“edu”對“當(dāng)前工資”的影響,稱為主效應(yīng),還要考慮“gender*edu”對“當(dāng)前工資”的影響,稱為交互效應(yīng)。
(1)分析步驟:將數(shù)據(jù)導(dǎo)入SPSS后,選擇:分析—— 一般線性模型——單變量
(2)將“當(dāng)前工資”選入因變量(也就是觀測變量),將性別“gender”與受教育年限“edu”選入固定因子(也就是控制變量)。
(3)選擇“單變量”的“模型”,打開對話框后選擇“全因子”,表示方差分析的模型包括所有因素的主效應(yīng),也包括因素之間的交互效應(yīng)。然后“繼續(xù)”。
(4)打開“單變量”的“繪制”對話框,選擇“gender”為橫軸變量,選擇“edu”為分線變量,單擊“添加”,即顯示這兩個因素變量的交互作用,即 “gender*edu”這個交互作用變量。由于此例中“gender”只有兩個水平,即男、女;而“edu”有多種水平。因此,如果主效應(yīng)顯著,則表明因素兩種或多種水平之間存在顯著性差異。事后可以繼續(xù)對同一因素多個水平之間的均值差異進(jìn)行比較,該過程稱為多重比較。
但實(shí)際上如果主效應(yīng)和交互效應(yīng)都達(dá)到顯著,我們更關(guān)心在多因素交互作用下,因變量有什么影響。
因此,如果交互效應(yīng)顯著的話,通常需要進(jìn)行簡單效應(yīng)檢驗(yàn)。所謂簡單效應(yīng)檢驗(yàn),是指一個因素的水平在另一個因素的某個因素的某個水平上的變異。例如我們本例中的,如果gender與edu之間存在顯著的交互作用,我們可以檢驗(yàn)當(dāng)gender為“女”時,edu的各個水平之間的差異,稱為edu在“女”性水平上的簡單效應(yīng);以及在“男”性水平上edu各水平之間的差異,稱為edu在“男”性水平上的簡單效應(yīng)。簡單效應(yīng)檢驗(yàn),實(shí)際上是把其中一個自變量固定在某一個特定的水平上,考察另一個自變量對因變量的影響。簡單效應(yīng)檢驗(yàn)在SPSS里是用一個“MANOVA”命令來實(shí)現(xiàn)的。同理,當(dāng)我們檢驗(yàn)三個自變量時,若這些自變量之間的交互作用顯著,需要進(jìn)行簡單簡單效應(yīng)檢驗(yàn),即一個因素的水平在另外兩個因素的水平結(jié)合上的效應(yīng)。也就是把兩個因素固定在各自的某一個水平上,考察第三個因素對因變量的影響。也是用“MANOVA”命令來實(shí)現(xiàn)的。我們觀察簡單效應(yīng)顯著與否,是通過F值與sig值來看的,一般用sig值與我們設(shè)定的一個數(shù)值(0.05、0.01、或者0.001)來比較,若sig值大于該數(shù)值,說明簡單效應(yīng)不顯著;反之,若sig值小于該數(shù)值,說明簡單效應(yīng)顯著。
(5)打開“選項(xiàng)”對話框,將左邊三個控制變量均移入右邊,“顯示均值”,同時選中“描述統(tǒng)計”,選中“比較主效應(yīng)”。
(6)點(diǎn)擊“確定”以后,就會在SPSS查看器里顯示出結(jié)果。其中,最上面的那部分代碼是我們所做的操作在SPSS里具體實(shí)現(xiàn)的步驟的代碼。下面的表格是我們想要的結(jié)果,從表格里得出結(jié)論。
(7)從下面的“主體間效應(yīng)的檢驗(yàn)”表格里,我們比較性別gender、受教育程度edu、及gender*edu交互作用的F值及sig值,看到edu的F值最大,sig值最小,且sig<0.05。而gender與gender*edu的sig值都大于0.05,得出結(jié)論:“gender”的主效應(yīng)未達(dá)到顯著,而“edu”的主效應(yīng)達(dá)到顯著,gender與edu的交互效應(yīng)未達(dá)到顯著(當(dāng)交互效應(yīng)達(dá)到顯著時,進(jìn)而可以進(jìn)行簡單效應(yīng)檢驗(yàn)結(jié)果),就不需要進(jìn)行簡單效應(yīng)檢驗(yàn)。則該公司員工“受教育程度”對員工“當(dāng)前工資”的影響顯著,而“性別”對“當(dāng)前工資”的影響不明顯。
(8)下圖為均值分布圖,即為兩因素edu與gender作用下,因變量員工工資的均值分布情況。通常,若交互效應(yīng)不顯著時,圖中的因素分布線均為平行線;若交互效應(yīng)顯著,圖中的因素分線不平行。此圖中,將性別“gender”作為橫軸變量,觀察接受教育年限“edu”對因變量“當(dāng)前工資”的影響。
圖中得出結(jié)論:當(dāng)受教育年限為20年,一般為研究生水平的時候,男女工資差別不大;受教育年限為14年,一般為專科生水平,男女工資差別不明顯。但當(dāng)受教育年限為8年、17年的時候,男女工資差別尤其明顯。
推薦學(xué)習(xí)書籍
《CDA一級教材》適合CDA一級考生備考,也適合業(yè)務(wù)及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計已有10萬+在讀~
免費(fèi)加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03