2020-08-30
閱讀量:
1176
如何解決線性模型變量相關(guān)性問題的討論
首先要明確一點(diǎn):變量之間的相關(guān)性(只要不是完全相關(guān))是不會(huì)影響參數(shù)的一致性的。
那么會(huì)影響什么呢?影響的是參數(shù)估計(jì)的方差。
所以,如果你的樣本足夠大,變量間的相關(guān)性不是什么大問題,甚至壓根就不是問題。
那么如果你的樣本沒那么大,該怎么處理呢?這個(gè)時(shí)候就要看你做模型的目的了。
簡(jiǎn)單的區(qū)分的話,你究竟關(guān)注相關(guān),還是因果,甚至只是想預(yù)測(cè)?
如果你是關(guān)注因果,那么不好意思,這個(gè)問題沒有辦法。比如如果在經(jīng)濟(jì)學(xué)里面,你如果刪掉任何一個(gè)變量,都會(huì)導(dǎo)致遺漏變量而產(chǎn)生偏誤,這個(gè)時(shí)候你的系數(shù)估計(jì)是不一致的。
如果僅僅是關(guān)注相關(guān),那么主成分分析等是個(gè)好的方法。此外如果你覺著有一些系數(shù)應(yīng)該為0,甚至還可以LASSO。
如果你是想預(yù)測(cè),那么雖然多重共線性導(dǎo)致系數(shù)估計(jì)方差變大,但是預(yù)測(cè)能力不會(huì)有所降低,所以這個(gè)問題沒有那么值得去處理。






評(píng)論(0)


暫無數(shù)據(jù)
CDA考試動(dòng)態(tài)
CDA報(bào)考指南
推薦帖子
0條評(píng)論
0條評(píng)論
0條評(píng)論