
SPSS帶你玩轉GLM方差分析,一學就會
方差分析(Analysis of Variance,簡稱ANOVA),又稱“變異數(shù)分析”或“F檢驗”,是R.A.Fisher發(fā)明的,用于兩個及兩個以上樣本均數(shù)差別的顯著性檢驗。它是以F值為統(tǒng)計量的計量資料的假設檢驗方法。檢驗方法是將總方差分解成兩個或多個部分方差和,推斷兩組或多組的總體無數(shù)是否相等。原假設H0:多個試驗組的總體均數(shù)相等,即處理因素無作用。檢驗水準:ɑ=0.05。
GLM(一般線性模型)一般用于完全隨機設計資料的方差分析(單因素方差分析)、隨機區(qū)組設計資料的方差分析(兩因素方差分析)、拉丁方設計資料的方差分析、交叉設計的方差分析、析因設計的方差分析、協(xié)方差分析和重復測量的方差分析。
SPSS方差分析模塊——General Linear Model
Univariate:單變量方差分析——單結局指標(y),適用多種試驗設計的分析
Multivariate:多變量方差分析——多結局指標(y1,y2…yk)
Repeated:重復測量方差分析
注意單因素方差分析是1個y,1個x(三分類以上),而單變量方差分析是1個y,1個或多個x,多變量方差分析是多個y,1個或多個x。單變量方差分析包含單因素方差分析(one-way ANOVA)。
1完全隨機設計資料的方差分析
完全隨機設計資料的方差分析是將同質的受試對象隨機地分配到各處理組,再觀察其試驗效應。各組樣本量可以相等或不等。通過考察單因素或單變量結果一致性,獲得一個因素的多個不同水平之間的關系,它也是t檢驗的擴展。適用條件是樣本為獨立隨機樣本,服從正態(tài)分布,各組方差齊同,單個因變量為連續(xù)變量等。
案例:
研究:3組不同藥物處理(A藥,B藥與安慰劑),觀察對糖化血紅蛋白的影響。
方法:為了研究三組糖化血紅蛋白水平的差異,采用one way ANOVA分析,也可以采用Univariate分析。
One-way ANOVA檢驗結果
Univariate分析:
SPSS操作:Analyze ? General linear model ? Univariate
其中,固定因子(fixed factor)是指該因子在樣本中所有可能的水平都出現(xiàn)了,即該因子的所有水平均列出了,無需外推。隨機因子(random factor)是指該因子的所有可能的水平在樣本中沒有都出現(xiàn),需要進行外推。可見固定因子和隨機因子是由試驗設計決定的,所以我們可以根據(jù)試驗設計的不同,將同一因素視為固定因子或隨機因子均可。
在試驗的設計中,協(xié)變量是一個獨立變量(解釋變量),不為試驗者所操縱,但仍影響實驗結果。在心理學、行為科學中,是指與因變量有線性相關并在探討自變量與因變量關系時通過統(tǒng)計技術加以控制的變量。常用的協(xié)變量包括因變量的前測分數(shù)、人口統(tǒng)計學指標以及與因變量明顯不同的個人特征等。
Univariate分析結果
Univariate分析結果與one way ANOVA結果完全一致!
2隨機區(qū)組設計資料的方差分析
隨機區(qū)組設計(randomized block design),是將受試對象按性質(如動物的性別、體重,病人的病情、性別、年齡等非試驗因素)相同或相近組成b個區(qū)組,每個區(qū)組中的k個受試對象分別隨機分配到k個處理組中去;區(qū)組間差別越大越好,區(qū)組內(nèi)差別越小越好。隨機區(qū)組設計的作用是進一步控制個體差異,檢驗效能高于完全隨機設計的方差分析。
1.單獨效應(simple effect):其他因素的水平固定時,同一因素不同水平間的差別。
2.主效應(main effect):因子不同水平設置對響應造成的差異(這時不考慮其他因子的水平設置)。
3.交互作用(interaction) :一個因子在另一個因子的不同水平下的主效應是否有差異。理解為條件主效應的差異。
案例:
原案例(完全隨機對照)中,考慮各處理組(A藥,B藥與安慰劑)對結局(糖化血紅蛋白)的影響,但糖尿病病程可能是對患者結局影響的重要混雜因素。我們可以在事先設計中,將糖尿病病程相近的36個人分成12個區(qū)組,再將每個區(qū)組的3個人隨機分入3組(隨機區(qū)組設計)。
隨機區(qū)組設計的分析方法
One-way ANOVA只能獨立分析各處理組對結局(糖化血紅蛋白)的影響,無法同時分析組別(試驗因素)和病程(控制因素)對結局的影響。此時應該采用Univariate分析。
Univariate分析設置:Model
對話框中選擇custom(自定義模型),Main effects(主效應),TypeⅢ(常見平方和類型)。DMDuration*group為交互效應,如果沒有交互一般不選擇這項。
Univariate分析設置:Contrasts
Contrast選擇Polynomial(多項式模型趨勢檢驗)。
Univariate分析設置: Post Hoc
Univariate結果解讀
主體間效應的檢驗
各組間糖化血紅蛋白水平,以及各病程間糖化血紅蛋白水平,以及病程對分組的交互影響不明顯。
期望均方表
類似方差分析表因素變異和殘差
兩個模型中,假定值均相同都等于0,故參照估計值和差值相等;參照估計值和差值在線性和二次模型中均p>0.05,表明均不服從模型;按α=0.05檢驗水準,各組糖化不呈線性和二次模型趨勢。
兩兩比較,同樣無顯著性差異。
3析因設計資料的方差分析
普通分組設計:A藥與B藥對比,或三組:A藥, B藥,安慰劑;析因設計:A藥與安慰劑;B藥與安慰劑。普通分組重點考察兩類藥物本身的對比。而析因則相對獨立成組,能比較A藥與安慰劑,B藥與安慰劑,但一般并不比較A藥與B藥間差異。析因能分析A與B的交互,普通分組則不可以。
析因設計(factorial)
研究目的:觀察兩類藥物對疾病的影響
Univariate分析設置
Univariate分析設置:Plots
Univariate分析設置:Model(參閱前文)
Univariate分析設置:Options
Univariate分析設置:contrasts(參閱前文)
Univariate分析設置: Post Hoc(參閱前文)
Univariate結果解讀
各處理組間,以及drug2對糖化血紅蛋白水平均無顯著性影響。
凡涉及存在交互效應,或不同效應因素(隨機效應,或協(xié)變量存在),都建議采用GLM方法,而并不建議用one-way ANOVA。完全隨機對照可以使用one-way ANOVA,但隨機區(qū)組設計和析因研究則要采用univariate方法分析。
4協(xié)方差分析
為了提高試驗的精確性和準確性,對處理以外的一切條件都需要采取有效措施嚴加控制,使它們在各處理間盡量一致,比如隨機區(qū)組設計。并且試驗設計也有可能疏忽,限于試驗條件的限制,因素無法掌控等,就要采用協(xié)方差分析。它是試驗控制的一種輔助手段。經(jīng)這種矯正,試驗誤差將減小,對試驗處理效應估計更為準確。
1、回歸:建立應變量Y隨協(xié)變量X變化的線性回歸關系,并利用這種回歸關系把X值化為相等后再進行各組Y的修正;
實質:從Y中扣除或均衡這些不可控的協(xié)變量因素的影響后,再比較多組均數(shù)間的差別。
協(xié)方差分析應用時要注意各組協(xié)變量X與因變量Y的關系是線性的,各組回歸直線平行。
推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業(yè)務及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計已有10萬+在讀~
免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03