不能隨意剔除變量
假設(shè)檢驗(yàn)的思路是在控制第I類錯誤的條件下進(jìn)行的。第I類錯誤也就是當(dāng)總體系數(shù)本身為0,但是我們卻錯誤的任務(wù)其不為0的錯誤。我們通常設(shè)定的顯著性水平,1%、5%、10%,都是犯第I類錯誤的概率。也就是說,我們可以保證我們犯第I類錯誤的概率在很小的水平,因而一旦顯著了,那么我們犯第I類錯誤的概率不會太大的,我們可以比較自信地認(rèn)為,系數(shù)的確不為0。注意對于一個比較好的檢驗(yàn),只要假設(shè)條件都滿足,這個犯錯誤的概率跟樣本量沒關(guān)系的:只要檢驗(yàn)是對的,犯第I類錯誤的概率就是我們設(shè)定的顯著性水平。
但是,如果我們做出來結(jié)果是不顯著的,如果犯錯誤那也是犯第II類錯誤:如果本身系數(shù)不為0,但是我們卻沒能拒絕原假設(shè)的錯誤。但是,悲觀的是,通常犯第II類錯誤的概率是不知道的,因而第II類錯誤的概率不僅取決于樣本量(樣本量越大越不容易犯錯),還取決于系數(shù)本身的大?。喝绻禂?shù)比較小,犯第II類錯誤的概率就會很大很大。
所以,如果做出來結(jié)果不顯著,此時我們并不知道我們犯第II類錯誤的概率有多大,在極端情況下可能接近于100%,因而如果不顯著就斷言沒有效應(yīng),或者系數(shù)為0,是非常非常武斷的。
這也就是我們常說的:不顯著不代表沒有。
那第二個問題,如果一個變量不顯著,對其他的系數(shù)估計就沒有影響嗎?當(dāng)然不是這樣。比如在一個回歸中有兩個變量,x和w,兩者都決定了y,但是做出來w不顯著。如果w和x之間是相關(guān)的,此時如果刪掉w的話,還是會導(dǎo)致遺漏變量問題:x的估計不再正確了。








暫無數(shù)據(jù)