2021-02-18
閱讀量:
944
WOE如果是這樣的非線性分布是不是不太適合拿來做邏輯回歸模型
建立評分卡模型時需要跨數(shù)據(jù)集檢驗WOE分箱的單調(diào)性。如果在訓(xùn)練集上保持單調(diào),但在驗證集和測試集上發(fā)生翻轉(zhuǎn)而不單調(diào),那么說明分箱并不合理,需要再次調(diào)整。
如果自變量x與因變量y之間存在非線性關(guān)系,也就是說x越大,不能保證預(yù)測為好人/壞人的概率也越大。比如:隨著x增大,P(Y=1|X)先增大,后變小。
此時可通過WOE變換,同時保持WOE曲線具備單調(diào)性,那么帶來的好處在于:
1. 若WOE中Odds定義為好壞比(good/bad),那么woe(x)越大,y預(yù)測為好人的概率越高;
2. 若WOE中Odds定義為壞好比(bad/good),那么woe(x)越大,y預(yù)測為壞人的概率越高;
這就保證新的自變量x' = woe(x)與y之間具備正(負(fù))相關(guān),更加符合我們的習(xí)慣——隨著x'增大,P(Y=1|X')也單調(diào)增大。
另一方面,LR這些線性模型的基本假設(shè)是x與y之間存在線性關(guān)系。






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論
0條評論
0條評論