與標(biāo)準(zhǔn)(OLS)線性模型一樣,模型適用性的評價對于廣義線性模型也非常重要。但遺憾的
是,對于標(biāo)準(zhǔn)的評價過程,統(tǒng)計圈子仍莫衷一是。一般來說,
當(dāng)評價模型的適用性時,你可以繪制初始響應(yīng)變量的預(yù)測值與殘差的圖形。例如,如下代碼
可繪制一個常見的診斷圖:
plot(predict(model, type="response"),
residuals(model, type= "deviance"))
其中, model為glm()函數(shù)返回的對象。
R將列出帽子值(hat value)、學(xué)生化殘差值和Cook距離統(tǒng)計量的近似值。不過,對于識別異
常點(diǎn)的閾值,現(xiàn)在并沒統(tǒng)一答案,它們都是通過相互比較來進(jìn)行判斷。其中一個方法就是繪制各
統(tǒng)計量的參考圖,然后找出異常大的值。例如,如下代碼可創(chuàng)建三幅診斷圖:
plot(hatvalues(model))
plot(rstudent(model))
plot(cooks.distance(model))
你還可以用其他方法,代碼如下:
library(car)
influencePlot(model)
它可以創(chuàng)建一個綜合性的診斷圖。在后面的圖形中,橫軸代表杠桿值,縱軸代表學(xué)生化殘差
值,而繪制的符號大小與Cook距離大小成正比。
當(dāng)響應(yīng)變量有許多值時,診斷圖非常有用;而當(dāng)響應(yīng)變量只有有限個值時(比如Logistic回
歸),診斷圖的功效就會降低很多。
若想更深入了解廣義線性模型的回歸診斷,可參考Fox(2008)和Faraway(2006)。








暫無數(shù)據(jù)