99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
2020-08-19 閱讀量: 8308
關(guān)于變量IV值測算問題

各位老師,請教個(gè)問題,我之前找了一段代碼測算變量的IV值,然后現(xiàn)在使用測試數(shù)據(jù)(虛假數(shù)據(jù))進(jìn)行IV測算的時(shí)候,代碼總是報(bào)錯(cuò),代碼本身試了其他數(shù)據(jù)是可以跑出來的,這組數(shù)據(jù)想請老師看下是什么問題,導(dǎo)致測算IV值總是報(bào)錯(cuò),測試數(shù)據(jù)已上傳至附件,代碼及報(bào)錯(cuò)信息見圖片,或者老師有其他方法可以測算出IV嗎

test.xlsx

#%% woe分箱, iv and transform
data_woe = data #用于存儲所有數(shù)據(jù)的woe值
civ_list = []
n_positive = sum(data['target'])
n_negtive = len(data) - n_positive
for column in list(data.columns[1:]):
    if data[column].dtypes == 'object':
        civ = fp.proc_woe_discrete(data, column, n_positive, n_negtive, 0.05*len(data), alpha=0.05)
    else:            
        civ = fp.proc_woe_continuous(data, column, n_positive, n_negtive, 0.05*len(data), alpha=0.05)
    civ_list.append(civ)
    data_woe[column] = fp.woe_trans(data[column], civ)
    
civ_df = eval.eval_feature_detail(civ_list,'data5.xlsx')

報(bào)錯(cuò)1.png

27.8619
4
關(guān)注作者
收藏
評論(4)

發(fā)表評論
wangxishi
2020-08-21

請問有更好的計(jì)算IV的代碼嗎?

0.0000 0 0 回復(fù)
PGC123
2020-08-21

目前還沒發(fā)現(xiàn)有能計(jì)算各種數(shù)據(jù),應(yīng)對各種情況的包。只能是根據(jù)遇到的具體問題、具體分析并探索出合理的解決方案。

0.0000 0 0 回復(fù)
wangxishi
2020-08-20

前面要先連接上python數(shù)據(jù)包:

import pandas as pd
import numpy as np
import os
import Data_quality_report as dqr
import scorecardpy as sc
import matplotlib.pyplot as plt
import woe.feature_process as fp
import woe.eval as eval
import math


35.8908 1 0 回復(fù)
wangxishi
2020-08-20

前面的報(bào)錯(cuò)是這樣的,截圖內(nèi)容是否夠?

報(bào)錯(cuò)1.png

35.8908 1 0 回復(fù)
PGC123
2020-08-20

我看了一下,代碼報(bào)錯(cuò)是因?yàn)檫@個(gè)日期類型不能使用這個(gè)庫來做分箱處理,可以考慮將時(shí)間這兩列拿出來人工分箱處理。包也是有局限性的,要么需要研究數(shù)據(jù)反復(fù)做數(shù)據(jù)預(yù)處理,要么需要研讀woe這個(gè)包的代碼并做一些修改才能真正完成。路漫漫兮其修遠(yuǎn)~

35.8908 2 0 回復(fù)
jdtk_gl
2020-08-19

請問代碼是那一句執(zhí)行報(bào)錯(cuò)了?

35.8908 1 0 回復(fù)
推薦帖子
條評論