與標(biāo)準(zhǔn)(OLS)線性模型一樣,模型適用性的評(píng)價(jià)對(duì)于廣義線性模型也非常重要。但遺憾的
是,對(duì)于標(biāo)準(zhǔn)的評(píng)價(jià)過程,統(tǒng)計(jì)圈子仍莫衷一是。一般來說,
當(dāng)評(píng)價(jià)模型的適用性時(shí),你可以繪制初始響應(yīng)變量的預(yù)測(cè)值與殘差的圖形。例如,如下代碼
可繪制一個(gè)常見的診斷圖:
plot(predict(model, type="response"),
residuals(model, type= "deviance"))
其中, model為glm()函數(shù)返回的對(duì)象。
R將列出帽子值(hat value)、學(xué)生化殘差值和Cook距離統(tǒng)計(jì)量的近似值。不過,對(duì)于識(shí)別異
常點(diǎn)的閾值,現(xiàn)在并沒統(tǒng)一答案,它們都是通過相互比較來進(jìn)行判斷。其中一個(gè)方法就是繪制各
統(tǒng)計(jì)量的參考圖,然后找出異常大的值。例如,如下代碼可創(chuàng)建三幅診斷圖:
plot(hatvalues(model))
plot(rstudent(model))
plot(cooks.distance(model))
你還可以用其他方法,代碼如下:
library(car)
influencePlot(model)
它可以創(chuàng)建一個(gè)綜合性的診斷圖。在后面的圖形中,橫軸代表杠桿值,縱軸代表學(xué)生化殘差
值,而繪制的符號(hào)大小與Cook距離大小成正比。
當(dāng)響應(yīng)變量有許多值時(shí),診斷圖非常有用;而當(dāng)響應(yīng)變量只有有限個(gè)值時(shí)(比如Logistic回
歸),診斷圖的功效就會(huì)降低很多。
若想更深入了解廣義線性模型的回歸診斷,可參考Fox(2008)和Faraway(2006)。








暫無數(shù)據(jù)