99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用案例
數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用案例
2015-12-01
收藏

數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用案例




信用卡業(yè)務(wù)具有透支筆數(shù)巨大、單筆金額小的特點,這使得數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用成為必然。國外信用卡發(fā)卡機構(gòu)已經(jīng)廣泛應(yīng)用數(shù)據(jù)挖掘技術(shù)促進信用卡業(yè)務(wù)的發(fā)展,實現(xiàn)全面的績效管理。我國自1985年發(fā)行第一張信用卡以來,信用卡業(yè)務(wù)得到了長足的發(fā)展,積累了巨量的數(shù)據(jù),數(shù)據(jù)挖掘在信用卡業(yè)務(wù)中的重要性日益顯現(xiàn)。

一、數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用主要有分析型客戶關(guān)系管理、風(fēng)險管理和運營管理。

1.分析型CRM

分析型CRM應(yīng)用包括市場細分、客戶獲取、交叉銷售和客戶流失。信用卡分析人員搜集和處理大量數(shù)據(jù),對這些數(shù)據(jù)進行分析,發(fā)現(xiàn)其數(shù)據(jù)模式及特征,分析某個客戶群體的特性、消費習(xí)慣、消費傾向和消費需求,進而推斷出相應(yīng)消費群體下一步的消費行為,然后以此為基礎(chǔ),對所識別出來的消費群體進行特定產(chǎn)品的主動營銷。這與傳統(tǒng)的不區(qū)分消費者對象特征的大規(guī)模營銷手段相比,大大節(jié)省了營銷成本,提高了營銷效果,從而能為銀行帶來更多的利潤。對客戶采用何種營銷方式是根據(jù)響應(yīng)模型預(yù)測得出的客戶購買概率做出的,對響應(yīng)概率高的客戶采用更為主動、人性化的營銷方式,如電話營銷、上門營銷;對響應(yīng)概率較低的客戶可選用成本較低的電子郵件和信件營銷方式。除獲取新客戶外,維護已有優(yōu)質(zhì)客戶的忠誠度也很重要,因為留住一個原有客戶的成本要遠遠低于開發(fā)一個新客戶的成本。在客戶關(guān)系管理中,通過數(shù)據(jù)挖掘技術(shù),找到流失客戶的特征,并發(fā)現(xiàn)其流失規(guī)律,就可以在那些具有相似特征的持卡人還未流失之前,對其進行有針對性的彌補,使得優(yōu)質(zhì)客戶能為銀行持續(xù)創(chuàng)造價值。

2.風(fēng)險管理

數(shù)據(jù)挖掘在信用卡業(yè)務(wù)中的另一個重要應(yīng)用就是風(fēng)險管理。在風(fēng)險管理中運用數(shù)據(jù)挖掘技術(shù)可建立各類信用評分模型。模型類型主要有三種:申請信用卡評分卡、行為信用評分卡和催收信用評分卡,分別為信用卡業(yè)務(wù)提供事前、事中、和事后的信用風(fēng)險控制。

申請評分模型專門用于對新申請客戶的信用評估,它應(yīng)用于信用卡征信審核階段,通過申請人填寫的有關(guān)個人信息,即可有效、快速地辨別和劃分客戶質(zhì)量,決定是否審批通過并對審批通過的申請人核定初始信用額度,幫助發(fā)卡行從源頭上控制風(fēng)險。申請評分模型不依賴于人們的主觀判斷或經(jīng)驗,有利于發(fā)卡行推行統(tǒng)一規(guī)范的授信政策。行為評分模型是針對已有持卡人,通過對持卡客戶的行為進行監(jiān)控和預(yù)測,從而評估持卡客戶的信用風(fēng)險,并根據(jù)模型結(jié)果,智能化地決定是否調(diào)整客戶信用額度,在授權(quán)時決定是否授權(quán)通過,到期換卡時是否進行續(xù)卡操作,對可能出現(xiàn)的使其提前進行預(yù)警。催收評分模型是申請評分模型和行為評分模型的補充,是在持卡人產(chǎn)生了逾期或壞賬的情況下建立的。催收評分卡被用于預(yù)測和評估對某一筆壞賬所采取措施的有效性,諸如客戶對警告信件反應(yīng)的可能性。這樣,發(fā)卡行就可以根據(jù)模型的預(yù)測,對不同程度的逾期客戶采取相應(yīng)措施進行處理。以上三種評分模型在建立時,所利用的數(shù)據(jù)主要是人口統(tǒng)計學(xué)數(shù)據(jù)和行為數(shù)據(jù)。人口統(tǒng)計學(xué)數(shù)據(jù)包括年齡、性別、婚姻狀況、教育背景、家庭成員特點、住房情況、職業(yè)、職稱、收入狀況等。行為數(shù)據(jù)包括持卡人在過去使用信用卡的表現(xiàn)信息,如使用頻率、金額、還款情況等。由此可見,數(shù)據(jù)挖掘技術(shù)的使用,可以使銀行有效地建立起事前、事中到事后的信用風(fēng)險控制體系。

3.運營管理

雖然數(shù)據(jù)挖掘在信用卡運營管理領(lǐng)域的應(yīng)用不是最重要的,但它已為國外多家發(fā)卡公司在提高生產(chǎn)效率、優(yōu)化流程、預(yù)測資金和服務(wù)需求、提供服務(wù)次序等問題的分析上取得了較大成績。

二、常用的數(shù)據(jù)挖掘方法

上述數(shù)據(jù)挖掘技術(shù)在信用卡領(lǐng)域的應(yīng)用中,有很多工具可用于開發(fā)預(yù)測和描述模型。有些用統(tǒng)計方法,如線性回歸邏輯回歸;有些有非統(tǒng)計或混合方法,如神經(jīng)網(wǎng)絡(luò)、遺傳算法、決策樹及回歸樹。這里僅討論幾種常見的典型方法。

1.線性回歸

簡單線性回歸分析是量化兩個連續(xù)變量之間關(guān)系的一種統(tǒng)計技術(shù)。這兩個變量分別是因變量(預(yù)測變量)。使用這一方法,可以發(fā)現(xiàn)一條穿過數(shù)據(jù)的線,線上的點使對應(yīng)數(shù)據(jù)點的方差最小。為市場營銷、風(fēng)險和客戶關(guān)系管理建立模型時,通常有多個自變量,用多個獨立自變量來預(yù)測一個連續(xù)變量稱為多元線性回歸,用線性回歸方法建立的模型通常具有魯棒性。

2.邏輯回歸

邏輯回歸是使用最廣泛的建模技術(shù),與線性回歸很相似。兩者的主要區(qū)別在于邏輯回歸的因變量(想預(yù)測變量)不是連續(xù)的,而是離散的或者類型變量。如申請評分模型可運用邏輯回歸方法,選取關(guān)鍵變量確定回歸系數(shù)。以申請者的關(guān)鍵變量x1,x2,…xm為自變量,以y=[1 申請者是壞客戶;0 申請者是好客戶,為因變量,則對于二分類因變量,一般假設(shè)客戶變壞的概率為 p(y=1)=eβ0 β1×1 … βmxm/1 eβ0 β1×1 … βmxm式中,β0,β1…,βm是常數(shù),即1n(p/1-p)=β0 β1×1 … βmxm

3.神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)處理和回歸處理大不相同,它不依照任何概率分布,而是模仿人腦功能,可以認為它是從每一次經(jīng)驗中提取并學(xué)習(xí)信息。神經(jīng)網(wǎng)絡(luò)系統(tǒng)由一系列類似于人腦神經(jīng)元一樣的節(jié)點組成,這些節(jié)點通過網(wǎng)絡(luò)彼此互連。如果有數(shù)據(jù)輸入,它們便可以進行確定數(shù)據(jù)模式的工作。神經(jīng)網(wǎng)絡(luò)由相互連接的輸入層、中間層(或隱藏層)、輸出層組成。中間層由多個節(jié)點組成,完成大部分網(wǎng)絡(luò)工作。輸出層輸出數(shù)據(jù)分析的執(zhí)行結(jié)果。

4.遺傳算法

與神經(jīng)元網(wǎng)絡(luò)類似,遺傳算法也不遵循任何概率分布,是源自“適者生存”的進化過程。它首先將問題的可能解按某種形式進行編碼,編碼后的解稱為染色體。隨機選取n個染色體作為初始種群,再根據(jù)預(yù)定的評價函數(shù)對每個染色體計算適應(yīng)值,性能較好的染色體有較高的適應(yīng)值。選擇適應(yīng)值較高的染色體進行復(fù)制,并通過遺傳算子產(chǎn)生一群新的更適應(yīng)環(huán)境的染色體,形成新的種群,直至最后收斂到一個最適應(yīng)環(huán)境的個體,得到問題的最優(yōu)化解。

5.決策樹

決策樹的目標是逐步將數(shù)據(jù)分類到不同的組或分支中,在因變量的值上建立最強劃分。由于分類規(guī)則比較直觀,所以易于理解。圖1為客戶響應(yīng)的決策樹,從中很容易識別出響應(yīng)率最高的組。

三、實例分析

以下以邏輯回歸方法建立信用卡申請評分模型為例,說明數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中的應(yīng)用。申請評分模型設(shè)計可分為7個基本步驟。

1.定義好客戶和壞客戶的標準

好客戶和壞客戶的標準根據(jù)適合管理的需要定義。按照國外的經(jīng)驗,建立一個預(yù)測客戶好壞的風(fēng)險模型所需的好、壞樣本至少各要有1000個左右。為了規(guī)避風(fēng)險,同時考慮到信用卡市場初期,銀行的效益來源主要是銷售商的傭金、信用卡利息、手續(xù)費收入和資金的運作利差。因此,一般銀行把降低客戶的逾期率作為一個主要的管理目標。比如,將壞客戶定義為出現(xiàn)過逾期60天以上的客戶;將壞客戶定義為出現(xiàn)過逾期60天以上的客戶;將好客戶定義為沒有30天以上逾期且當(dāng)前沒有逾期的客戶。

一般來講,在同一樣本空間內(nèi),好客戶的數(shù)量要遠遠大于壞客戶的數(shù)量。為了保證模型具有較高的識別壞客戶的能力,取好、壞客戶樣本數(shù)比率為1:1。

2.確定樣本空間

樣本空間的確定要考慮樣本是否具有代表性。一個客戶是好客戶,表明持卡人在一段觀察期內(nèi)用卡表現(xiàn)良好;而一個客戶只要出現(xiàn)過“壞”的記錄,就把他認定為壞客戶。所以,一般好客戶的觀察期要比壞客戶長一些、好、壞客戶可以選擇在不同的時間段,即不同的樣本空間內(nèi)。比如,好客戶的樣本空間為2003年11月-2003年12月的申請人,壞客戶的樣本空間為2003年11月-2004年5月的申請人,這樣既能保證好客戶的表現(xiàn)期較長,又能保證有足夠數(shù)量的壞客戶樣本。當(dāng)然,抽樣的好、壞客戶都應(yīng)具有代表性。

3.數(shù)據(jù)來源

在美國,有統(tǒng)一的信用局對個人信用進行評分,通常被稱為“FICO評分”。美國的銀行、信用卡公司和金融機構(gòu)在對客戶進行信用風(fēng)險分析時,可以利用信用局對個人的數(shù)據(jù)報告。在我國,由于征信系統(tǒng)還不完善,建模數(shù)據(jù)主要來自申請表。隨著我國全國性征信系統(tǒng)的逐步完善,未來建模的一部分數(shù)據(jù)可以從征信機構(gòu)收集到。

4.數(shù)據(jù)整理

大量取樣的數(shù)據(jù)要真正最后進入模型,必須經(jīng)過數(shù)據(jù)整理。在數(shù)據(jù)處理時應(yīng)注意檢查數(shù)據(jù)的邏輯性、區(qū)分“數(shù)據(jù)缺失”和“0”、根據(jù)邏輯推斷某些值、尋找反常數(shù)據(jù)、評估是否真實。可以通過求最小值、最大值和平均值的方法,初步驗證抽樣數(shù)據(jù)是否隨機、是否具有代表性。

5.變量選擇

變量選擇要同時具有數(shù)學(xué)統(tǒng)計的正確性和信用卡實際業(yè)務(wù)的解釋力。Logistic回歸方法是盡可能準確找到能夠預(yù)測因變量的自變量,并給予各自變量一定權(quán)重。若自變量數(shù)量太少,擬合的效果不好,不能很好地預(yù)測因變量的情況;若自變量太多,會形成過分擬合,預(yù)測因變量的效果同樣不好。所以應(yīng)減少一些自變量,如用虛擬變量表示不能量化的變量、用單變量和決策樹分析篩選變量。與因變量相關(guān)性差不多的自變量可以歸為一類,如地區(qū)對客戶變壞概率的影響,假設(shè)廣東和福建兩省對壞客戶的相關(guān)性分別為-0.381和-0.380,可將這兩個地區(qū)歸為一類,另外,可以根據(jù)申請表上的信息構(gòu)造一些自變量,比如結(jié)合申請表上“婚姻狀況”和“撫養(yǎng)子女”,根據(jù)經(jīng)驗和常識結(jié)合這兩個字段,構(gòu)造新變量“已婚有子女”,進入模型分析這個變量是不真正具有統(tǒng)計預(yù)測性。

6.模型建立

借助SAS9軟件,用逐步回歸法對變量進行篩選。這里設(shè)計了一種算法,分為6個步驟。

步驟1:求得多變量相關(guān)矩陣(若是虛擬變量,則>0.5屬于比較相關(guān);若是一般變量,則>0.7-0.8屬于比較相關(guān))。

步驟2:旋轉(zhuǎn)主成分分析(一般變量要求>0.8屬于比較相關(guān);虛擬變量要求>0.6-0.7屬于比較相關(guān))。

步驟3:在第一主成分和第二主成分分別找出15個變量,共30個變量。

步驟4:計算所有30個變量對好/壞的相關(guān)性,找出相關(guān)性大的變量加入步驟3得出的變量。

步驟5:計算VIF。若VIF數(shù)值比較大,查看步驟1中的相關(guān)矩陣,并分別分析這兩個變量對模型的作用,剔除相關(guān)性較小的一個。

步驟6:循環(huán)步驟4和步驟5,直到找到所有變量,且達到多變量相關(guān)矩陣相關(guān)性很而單個變量對模型貢獻作用大。

7.模型驗證

在收集數(shù)據(jù)時,把所有整理好的數(shù)據(jù)分為用于建立模型的建模樣本和用于模型驗證的對照樣本。對照樣本用于對模型總體預(yù)測性、穩(wěn)定性進行驗證。申請評分模型的模型檢驗指標包括K-S值、ROC、AR等指標。雖然受到數(shù)據(jù)不干凈等客觀因素的影響,本例申請評分模型的K-S值已經(jīng)超過0.4,達到了可以使用的水平。

四、數(shù)據(jù)挖掘在國內(nèi)信用卡市場的發(fā)展前景

在國外,信用卡業(yè)務(wù)信息化程度較高,數(shù)據(jù)庫中保留了大量的數(shù)量資源,運用數(shù)據(jù)技術(shù)建立的各類模型在信用卡業(yè)務(wù)中的實施非常成功。目前國內(nèi)信用卡發(fā)卡銀行首先利用數(shù)據(jù)挖掘建立申請評分模型,作為在信用卡業(yè)務(wù)中應(yīng)用的第一步,不少發(fā)卡銀行已經(jīng)用自己的歷史數(shù)據(jù)建立了客戶化的申請評分模型??傮w而言,數(shù)據(jù)挖掘在我國信用卡業(yè)務(wù)中的應(yīng)用處于數(shù)據(jù)質(zhì)量問題,難于構(gòu)建業(yè)務(wù)模型。

隨著國內(nèi)各家發(fā)卡銀行已經(jīng)建立或著手建立數(shù)據(jù)倉庫,將不同操作源的數(shù)據(jù)存放到一個集中的環(huán)境中,并且進行適當(dāng)?shù)那逑春娃D(zhuǎn)換。這為數(shù)據(jù)挖掘提供了一個很好的操作平臺,將給數(shù)據(jù)挖掘帶來各種便利和功能。人民銀行的個人征信系統(tǒng)也已上線,在全國范圍內(nèi)形成了個人信用數(shù)據(jù)的集中。在內(nèi)部環(huán)境和外部環(huán)境不斷改善的基礎(chǔ)上,數(shù)據(jù)挖掘技術(shù)在信用卡業(yè)務(wù)中將具有越來越廣闊的應(yīng)用前景。


數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }