但在許多情況下,假設(shè)因變量為正態(tài)分布(甚
至連續(xù)型變量)并不合理,例如下面這幾種情況。
? 結(jié)果變量可能是類(lèi)別型的。二值變量(比如:是/否、通過(guò)/未通過(guò)、活著/死亡)和多分類(lèi)
變量(比如差/良好/優(yōu)秀)都顯然不是正態(tài)分布。
? 結(jié)果變量可能是計(jì)數(shù)型的(比如,一周交通事故的數(shù)目,每日酒水消耗的數(shù)量)。這類(lèi)變
量都是非負(fù)的有限值,而且它們的均值和方差通常都是相關(guān)的(正態(tài)分布變量間不是如
此,而是相互獨(dú)立)。
廣義線(xiàn)性模型擴(kuò)展了線(xiàn)性模型的框架,它包含了非正態(tài)因變量的分析。
在本章中,我們將首先簡(jiǎn)要概述廣義線(xiàn)性模型,并介紹如何使用glm()函數(shù)來(lái)進(jìn)行估計(jì)。然
后重點(diǎn)關(guān)注該框架中兩種流行的模型: Logistic回歸(因變量為類(lèi)別型)和泊松回歸(因變量為
計(jì)數(shù)型)。
為了讓討論更有吸引力,我們將把廣義線(xiàn)性模型應(yīng)用到兩個(gè)用標(biāo)準(zhǔn)線(xiàn)性模型無(wú)法輕易解決的
問(wèn)題上。
? 什么樣的個(gè)人信息、人口統(tǒng)計(jì)信息和人際關(guān)系信息可以作為變量,用來(lái)預(yù)測(cè)婚姻出軌問(wèn)
題?此時(shí),結(jié)果變量為二值型(出軌/未出軌)。
? 藥物治療對(duì)于八周中所發(fā)生的癲癇次數(shù)有何影響?此時(shí),結(jié)果變量為計(jì)數(shù)型(癲癇次數(shù))。
我們將利用Logistic回歸來(lái)闡釋第一個(gè)問(wèn)題,用泊松回歸闡釋第二個(gè)問(wèn)題。建模過(guò)程中,將
還考慮對(duì)每種方法進(jìn)行擴(kuò)展。








暫無(wú)數(shù)據(jù)