2022-09-02
閱讀量:
2835
建立線性回歸模型的步驟
1明確需求
2采集數(shù)據(jù)
3數(shù)據(jù)清洗: a.重復(fù)值的處理 b.缺失值的處理 c.異常值的處理 d.數(shù)據(jù)編碼的處理
其中缺失值的處理可以用均值或眾數(shù)等描述數(shù)據(jù)集中趨勢的進行填補,異常值中的錯誤值直接手動刪除,離群值的 處理要具體看業(yè)務(wù)(通常通過畫箱線圖,或者3西格瑪法則判斷),數(shù)據(jù)編碼的處理,對于男女這種二分類變量可以用 0和1轉(zhuǎn)化,最好的是在此基礎(chǔ)上加上交叉列(改斜率),多分類變量如學(xué)歷這種,可以采用獨熱編碼或啞變量轉(zhuǎn)換,其 中的某列得刪除,避免和線性回歸模型中的常量在矩陣化時有相關(guān)性
4變量的篩選:查看X與Y的相關(guān)系數(shù),查看散點圖
5分割測試集訓(xùn)練集(做預(yù)測)
6回歸建模(F檢驗,T檢驗,調(diào)整R^2)
7模型調(diào)優(yōu)
8模型精修(交叉項,高次項,季節(jié)趨勢)
9逐步回歸
10模型測試






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論
0條評論