
SPSS帶你玩轉(zhuǎn)GLM方差分析,一學(xué)就會(huì)
方差分析(Analysis of Variance,簡稱ANOVA),又稱“變異數(shù)分析”或“F檢驗(yàn)”,是R.A.Fisher發(fā)明的,用于兩個(gè)及兩個(gè)以上樣本均數(shù)差別的顯著性檢驗(yàn)。它是以F值為統(tǒng)計(jì)量的計(jì)量資料的假設(shè)檢驗(yàn)方法。檢驗(yàn)方法是將總方差分解成兩個(gè)或多個(gè)部分方差和,推斷兩組或多組的總體無數(shù)是否相等。原假設(shè)H0:多個(gè)試驗(yàn)組的總體均數(shù)相等,即處理因素?zé)o作用。檢驗(yàn)水準(zhǔn):ɑ=0.05。
GLM(一般線性模型)一般用于完全隨機(jī)設(shè)計(jì)資料的方差分析(單因素方差分析)、隨機(jī)區(qū)組設(shè)計(jì)資料的方差分析(兩因素方差分析)、拉丁方設(shè)計(jì)資料的方差分析、交叉設(shè)計(jì)的方差分析、析因設(shè)計(jì)的方差分析、協(xié)方差分析和重復(fù)測量的方差分析。
SPSS方差分析模塊——General Linear Model
Univariate:單變量方差分析——單結(jié)局指標(biāo)(y),適用多種試驗(yàn)設(shè)計(jì)的分析
Multivariate:多變量方差分析——多結(jié)局指標(biāo)(y1,y2…yk)
Repeated:重復(fù)測量方差分析
注意單因素方差分析是1個(gè)y,1個(gè)x(三分類以上),而單變量方差分析是1個(gè)y,1個(gè)或多個(gè)x,多變量方差分析是多個(gè)y,1個(gè)或多個(gè)x。單變量方差分析包含單因素方差分析(one-way ANOVA)。
1完全隨機(jī)設(shè)計(jì)資料的方差分析
完全隨機(jī)設(shè)計(jì)資料的方差分析是將同質(zhì)的受試對(duì)象隨機(jī)地分配到各處理組,再觀察其試驗(yàn)效應(yīng)。各組樣本量可以相等或不等。通過考察單因素或單變量結(jié)果一致性,獲得一個(gè)因素的多個(gè)不同水平之間的關(guān)系,它也是t檢驗(yàn)的擴(kuò)展。適用條件是樣本為獨(dú)立隨機(jī)樣本,服從正態(tài)分布,各組方差齊同,單個(gè)因變量為連續(xù)變量等。
案例:
研究:3組不同藥物處理(A藥,B藥與安慰劑),觀察對(duì)糖化血紅蛋白的影響。
方法:為了研究三組糖化血紅蛋白水平的差異,采用one way ANOVA分析,也可以采用Univariate分析。
One-way ANOVA檢驗(yàn)結(jié)果
Univariate分析:
SPSS操作:Analyze ? General linear model ? Univariate
其中,固定因子(fixed factor)是指該因子在樣本中所有可能的水平都出現(xiàn)了,即該因子的所有水平均列出了,無需外推。隨機(jī)因子(random factor)是指該因子的所有可能的水平在樣本中沒有都出現(xiàn),需要進(jìn)行外推。可見固定因子和隨機(jī)因子是由試驗(yàn)設(shè)計(jì)決定的,所以我們可以根據(jù)試驗(yàn)設(shè)計(jì)的不同,將同一因素視為固定因子或隨機(jī)因子均可。
在試驗(yàn)的設(shè)計(jì)中,協(xié)變量是一個(gè)獨(dú)立變量(解釋變量),不為試驗(yàn)者所操縱,但仍影響實(shí)驗(yàn)結(jié)果。在心理學(xué)、行為科學(xué)中,是指與因變量有線性相關(guān)并在探討自變量與因變量關(guān)系時(shí)通過統(tǒng)計(jì)技術(shù)加以控制的變量。常用的協(xié)變量包括因變量的前測分?jǐn)?shù)、人口統(tǒng)計(jì)學(xué)指標(biāo)以及與因變量明顯不同的個(gè)人特征等。
Univariate分析結(jié)果
Univariate分析結(jié)果與one way ANOVA結(jié)果完全一致!
2隨機(jī)區(qū)組設(shè)計(jì)資料的方差分析
隨機(jī)區(qū)組設(shè)計(jì)(randomized block design),是將受試對(duì)象按性質(zhì)(如動(dòng)物的性別、體重,病人的病情、性別、年齡等非試驗(yàn)因素)相同或相近組成b個(gè)區(qū)組,每個(gè)區(qū)組中的k個(gè)受試對(duì)象分別隨機(jī)分配到k個(gè)處理組中去;區(qū)組間差別越大越好,區(qū)組內(nèi)差別越小越好。隨機(jī)區(qū)組設(shè)計(jì)的作用是進(jìn)一步控制個(gè)體差異,檢驗(yàn)效能高于完全隨機(jī)設(shè)計(jì)的方差分析。
1.單獨(dú)效應(yīng)(simple effect):其他因素的水平固定時(shí),同一因素不同水平間的差別。
2.主效應(yīng)(main effect):因子不同水平設(shè)置對(duì)響應(yīng)造成的差異(這時(shí)不考慮其他因子的水平設(shè)置)。
3.交互作用(interaction) :一個(gè)因子在另一個(gè)因子的不同水平下的主效應(yīng)是否有差異。理解為條件主效應(yīng)的差異。
案例:
原案例(完全隨機(jī)對(duì)照)中,考慮各處理組(A藥,B藥與安慰劑)對(duì)結(jié)局(糖化血紅蛋白)的影響,但糖尿病病程可能是對(duì)患者結(jié)局影響的重要混雜因素。我們可以在事先設(shè)計(jì)中,將糖尿病病程相近的36個(gè)人分成12個(gè)區(qū)組,再將每個(gè)區(qū)組的3個(gè)人隨機(jī)分入3組(隨機(jī)區(qū)組設(shè)計(jì))。
隨機(jī)區(qū)組設(shè)計(jì)的分析方法
One-way ANOVA只能獨(dú)立分析各處理組對(duì)結(jié)局(糖化血紅蛋白)的影響,無法同時(shí)分析組別(試驗(yàn)因素)和病程(控制因素)對(duì)結(jié)局的影響。此時(shí)應(yīng)該采用Univariate分析。
Univariate分析設(shè)置:Model
對(duì)話框中選擇custom(自定義模型),Main effects(主效應(yīng)),TypeⅢ(常見平方和類型)。DMDuration*group為交互效應(yīng),如果沒有交互一般不選擇這項(xiàng)。
Univariate分析設(shè)置:Contrasts
Contrast選擇Polynomial(多項(xiàng)式模型趨勢檢驗(yàn))。
Univariate分析設(shè)置: Post Hoc
Univariate結(jié)果解讀
主體間效應(yīng)的檢驗(yàn)
各組間糖化血紅蛋白水平,以及各病程間糖化血紅蛋白水平,以及病程對(duì)分組的交互影響不明顯。
期望均方表
類似方差分析表因素變異和殘差
兩個(gè)模型中,假定值均相同都等于0,故參照估計(jì)值和差值相等;參照估計(jì)值和差值在線性和二次模型中均p>0.05,表明均不服從模型;按α=0.05檢驗(yàn)水準(zhǔn),各組糖化不呈線性和二次模型趨勢。
兩兩比較,同樣無顯著性差異。
3析因設(shè)計(jì)資料的方差分析
普通分組設(shè)計(jì):A藥與B藥對(duì)比,或三組:A藥, B藥,安慰劑;析因設(shè)計(jì):A藥與安慰劑;B藥與安慰劑。普通分組重點(diǎn)考察兩類藥物本身的對(duì)比。而析因則相對(duì)獨(dú)立成組,能比較A藥與安慰劑,B藥與安慰劑,但一般并不比較A藥與B藥間差異。析因能分析A與B的交互,普通分組則不可以。
析因設(shè)計(jì)(factorial)
研究目的:觀察兩類藥物對(duì)疾病的影響
Univariate分析設(shè)置
Univariate分析設(shè)置:Plots
Univariate分析設(shè)置:Model(參閱前文)
Univariate分析設(shè)置:Options
Univariate分析設(shè)置:contrasts(參閱前文)
Univariate分析設(shè)置: Post Hoc(參閱前文)
Univariate結(jié)果解讀
各處理組間,以及drug2對(duì)糖化血紅蛋白水平均無顯著性影響。
凡涉及存在交互效應(yīng),或不同效應(yīng)因素(隨機(jī)效應(yīng),或協(xié)變量存在),都建議采用GLM方法,而并不建議用one-way ANOVA。完全隨機(jī)對(duì)照可以使用one-way ANOVA,但隨機(jī)區(qū)組設(shè)計(jì)和析因研究則要采用univariate方法分析。
4協(xié)方差分析
為了提高試驗(yàn)的精確性和準(zhǔn)確性,對(duì)處理以外的一切條件都需要采取有效措施嚴(yán)加控制,使它們?cè)诟魈幚黹g盡量一致,比如隨機(jī)區(qū)組設(shè)計(jì)。并且試驗(yàn)設(shè)計(jì)也有可能疏忽,限于試驗(yàn)條件的限制,因素?zé)o法掌控等,就要采用協(xié)方差分析。它是試驗(yàn)控制的一種輔助手段。經(jīng)這種矯正,試驗(yàn)誤差將減小,對(duì)試驗(yàn)處理效應(yīng)估計(jì)更為準(zhǔn)確。
1、回歸:建立應(yīng)變量Y隨協(xié)變量X變化的線性回歸關(guān)系,并利用這種回歸關(guān)系把X值化為相等后再進(jìn)行各組Y的修正;
2、方差:各組Y的修正均數(shù)間比較的假設(shè)檢驗(yàn)。
實(shí)質(zhì):從Y中扣除或均衡這些不可控的協(xié)變量因素的影響后,再比較多組均數(shù)間的差別。
協(xié)方差分析應(yīng)用時(shí)要注意各組協(xié)變量X與因變量Y的關(guān)系是線性的,各組回歸直線平行。
推薦學(xué)習(xí)書籍
《CDA一級(jí)教材》適合CDA一級(jí)考生備考,也適合業(yè)務(wù)及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計(jì)已有10萬+在讀~
免費(fèi)加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03