不能隨意剔除變量
假設(shè)檢驗(yàn)的思路是在控制第I類錯(cuò)誤的條件下進(jìn)行的。第I類錯(cuò)誤也就是當(dāng)總體系數(shù)本身為0,但是我們卻錯(cuò)誤的任務(wù)其不為0的錯(cuò)誤。我們通常設(shè)定的顯著性水平,1%、5%、10%,都是犯第I類錯(cuò)誤的概率。也就是說(shuō),我們可以保證我們犯第I類錯(cuò)誤的概率在很小的水平,因而一旦顯著了,那么我們犯第I類錯(cuò)誤的概率不會(huì)太大的,我們可以比較自信地認(rèn)為,系數(shù)的確不為0。注意對(duì)于一個(gè)比較好的檢驗(yàn),只要假設(shè)條件都滿足,這個(gè)犯錯(cuò)誤的概率跟樣本量沒關(guān)系的:只要檢驗(yàn)是對(duì)的,犯第I類錯(cuò)誤的概率就是我們?cè)O(shè)定的顯著性水平。
但是,如果我們做出來(lái)結(jié)果是不顯著的,如果犯錯(cuò)誤那也是犯第II類錯(cuò)誤:如果本身系數(shù)不為0,但是我們卻沒能拒絕原假設(shè)的錯(cuò)誤。但是,悲觀的是,通常犯第II類錯(cuò)誤的概率是不知道的,因而第II類錯(cuò)誤的概率不僅取決于樣本量(樣本量越大越不容易犯錯(cuò)),還取決于系數(shù)本身的大?。喝绻禂?shù)比較小,犯第II類錯(cuò)誤的概率就會(huì)很大很大。
所以,如果做出來(lái)結(jié)果不顯著,此時(shí)我們并不知道我們犯第II類錯(cuò)誤的概率有多大,在極端情況下可能接近于100%,因而如果不顯著就斷言沒有效應(yīng),或者系數(shù)為0,是非常非常武斷的。
這也就是我們常說(shuō)的:不顯著不代表沒有。
那第二個(gè)問(wèn)題,如果一個(gè)變量不顯著,對(duì)其他的系數(shù)估計(jì)就沒有影響嗎?當(dāng)然不是這樣。比如在一個(gè)回歸中有兩個(gè)變量,x和w,兩者都決定了y,但是做出來(lái)w不顯著。如果w和x之間是相關(guān)的,此時(shí)如果刪掉w的話,還是會(huì)導(dǎo)致遺漏變量問(wèn)題:x的估計(jì)不再正確了。








暫無(wú)數(shù)據(jù)