
互金時代大數(shù)據(jù)在貸后管理中的應用
在互聯(lián)網(wǎng)金融時代,無論是傳統(tǒng)商業(yè)銀行還是新興的互聯(lián)網(wǎng)金融公司,面臨的風險和挑戰(zhàn)日益增加。在這種情況下,如何利用大數(shù)據(jù)技術及時有效地防堵各類信貸風險,也一直是各界關注的熱點問題。大數(shù)據(jù)技術可以讓貸后管理變得更簡單嗎?這篇來自“朝陽35處”的文章,將著重講解這方面的應用。
個人信貸不良資產管理壓力增大,貸后管理成管控重點
近年來,隨著我國個人信貸市場業(yè)務規(guī)??焖僭鲩L,個人不良貸款余額和不良率不斷走高也成為困擾金融信貸機構的首要問題。以銀行個人信貸業(yè)務為例(如圖1所示),其2015年第二季度不良貸款余額已達到1.18萬億元,不良貸款率也達到1.6%。
圖一
相比于銀行,互聯(lián)網(wǎng)金融平臺不良資產的問題和難點則更加凸顯。陸金所董事長兼CEO 計葵生年初曾對媒體表示,網(wǎng)貸行業(yè)平均不良率高達13%-17%。相對于傳統(tǒng)金融機構,互聯(lián)網(wǎng)網(wǎng)貸行業(yè)平均不良率明顯更高。
面對這一嚴峻形勢,不良資產的管理能力逐漸成為金融信貸機構關注的重點領域。
不良資產管控的核心有兩大方面,一是控制不良資產新增,二是化解存量不良資產。控制不良資產新增的有效手段是在“貸前”階段建立完善風險管理措施,嚴格把控客戶準入門檻。
而化解存量不良資產的核心則是“貸后管理”。
所謂貸后管理,主要內容是對不良資產進行有效評估,并以此為基礎對客戶進行分群,輔以失聯(lián)修復手段,對不同客群采取差異化的催收策略。
貸后管理是不良資產管控的重點,而失聯(lián)修復則是化解存量不良資產的先決條件。
以貸后管理中的催收為例,現(xiàn)階段催收人員只能通過借貸人申請貸款時留下的三到五個關聯(lián)號碼和其進行聯(lián)系。如果借貸人當時本就無心償還貸款,已有號碼有效率會非常低。就現(xiàn)在的國內個人信貸市場而言,新客戶中失聯(lián)比例達到30%~50%,而在進入不良階段后,客戶失聯(lián)比例高達70%。
這時,對大部分商業(yè)銀行和互聯(lián)網(wǎng)金融公司而言,只使用貸款人當時提供的聯(lián)系方式使貸后催收變得困難,需要尋求外部數(shù)據(jù)的支持協(xié)助。只有在結合外部數(shù)據(jù)對失聯(lián)客戶進行信息修復,可以很大程度上幫助催收部門和客戶重新取得聯(lián)系,從而化解存量不良資產。
然而,在初步修復客戶信息后,新的問題出現(xiàn)了。一種經常出現(xiàn)的情況是,與客戶有關聯(lián)的聯(lián)系人過多,有些客戶的聯(lián)系人可以多達幾十個甚至上百個。這又給催收人員帶來了另一種窘境,在面對過多的電話號碼,如果一個個撥打,不僅耗時耗力更不符合實際情況。即使手上掌握了欠款客戶充足的信息,但如果聯(lián)系號碼數(shù)量巨大,則修復率并不能夠被保證。
大數(shù)據(jù)模型助力提升失聯(lián)修復率
下面我們來舉例說明,利用大數(shù)據(jù)篩選模型,如何解決客戶聯(lián)系人號碼過多的問題。首先我們需要建立一個模型來對眾多號碼修復的成功率進行預測,從而通過篩選或排序,使催收人員可以從最可靠的號碼開始聯(lián)系客戶。
我們可以先選取小規(guī)模的數(shù)據(jù)集進行研究。比如,我們抽樣選取了9000多個聯(lián)系人的數(shù)據(jù),每組數(shù)據(jù)包括聯(lián)系人的電話號碼,對應的數(shù)據(jù)來源,電話更新時間以及是否有效修復失聯(lián)的標簽。其中,能夠修復失聯(lián)的定義為:電話號碼是有效可以撥通,且聯(lián)系人表示認識并愿意轉告客戶,積極提供客戶信息;而空號,不可撥通,聯(lián)系人態(tài)度差,表示不認識,或者認識客戶但不愿意聯(lián)系客戶的電話號碼則為無效。
這9000個樣本聯(lián)系人號碼在數(shù)億量級的全量數(shù)據(jù)庫中,與其他聯(lián)系人號碼通過各種關系形成了一個個網(wǎng)絡。如圖二所示,一個節(jié)點代表一個聯(lián)系人的電話號碼,而兩點之間的邊則代表這兩個電話號碼之間存在某種關系。每個節(jié)點的自由度定義為與這個節(jié)點相連的邊的數(shù)目。通過分析網(wǎng)絡中每個節(jié)點的自由度,我們可以進一步得知與每個號碼有聯(lián)系的號碼個數(shù)。以節(jié)點1為例,該電話號碼與4個號碼有聯(lián)系,它的自由度為4;節(jié)點2的自由度為3。節(jié)點的自由度越高,代表持有該號碼的人的社交圈子越大。
圖二
1.使用單變量分析
首先我們用單變量分析的方法看一下節(jié)點自由度、更新時間以及不同數(shù)據(jù)源對失聯(lián)修復率的影響。圖三顯示了節(jié)點自由度與失聯(lián)修復率的關系。當節(jié)點自由度為1時,失聯(lián)修復率最低,只有14%。隨著節(jié)點自由度的增大,失聯(lián)修復率也隨之提高。當節(jié)點自由度為3時,失聯(lián)修復率達到極值24%。隨后,失聯(lián)修復率隨節(jié)點自由度的增大而降低。
圖三
圖四顯示了電話號碼更新時間與失聯(lián)修復率的關系。由圖可見,失聯(lián)修復所使用的信息幾乎99%都來源于最近四年的數(shù)據(jù)。其中,2014年更新的數(shù)據(jù)失聯(lián)修復率最高,達到18%,而2015年更新的數(shù)據(jù)失聯(lián)修復率最低,只有11%。
圖四
圖五顯示了不同數(shù)據(jù)源與失聯(lián)修復率的關系。我們整合了九個不同的內、外部數(shù)據(jù)源,所有的數(shù)據(jù)源均有用戶授權。為了保護商業(yè)機密,我們不對數(shù)據(jù)源進行公布。但可以看到的是,數(shù)據(jù)源2、3和4的失聯(lián)修復率最佳,均可達到20%,而數(shù)據(jù)源7表現(xiàn)最差,只有10%的失聯(lián)修復率。
圖五
2.使用機器學習模型
上述的單變量分析只能統(tǒng)計單個變量對失聯(lián)修復率的影響,如果這些變量相互獨立,我們可以通過簡單的乘法公式計算出這些變量聯(lián)合起來對失聯(lián)修復率的影響。然而,這些變量顯然不是相互獨立的,而是彼此關聯(lián)的。例如,對于數(shù)據(jù)源1,當電話號碼的更新時間為2014年時,失聯(lián)修復率最高;而對于另外一個數(shù)據(jù)源,當電話號碼的更新時間為2016年時,失聯(lián)修復率最高。
為了分析這些相互關聯(lián)的變量聯(lián)合起來對失聯(lián)修復率的影響,我們采用Gradient Boosting非參數(shù)模型進行建模,來預測某個號碼失聯(lián)修復的概率。為了驗證模型效果,我們將數(shù)據(jù)集進行拆分,其中訓練集大小為6000,而測試集大小為3000。
在訓練集上訓練好模型之后,其在測試集上的表現(xiàn)如圖六所示。修復概率排名前10%的號碼的失聯(lián)修復率為28.1%,這相對于整個數(shù)據(jù)源15.3%的平均修復率,提升達到了83%!這種優(yōu)化帶來的收益非常明顯,如果與某客戶相關聯(lián)的聯(lián)系人號碼超過十個甚至上百個,通過上述方式的篩選則可以得到五到六個質量較高的聯(lián)系人號碼,使得催收人員輕松有效地找到失聯(lián)客戶;如果一個失聯(lián)客戶聯(lián)系人數(shù)目較少,催收人員也可以按照大數(shù)據(jù)模型給出的電話號碼靠譜程度排序,從高到低進行撥打,從而更快找到失聯(lián)客戶,顯著提升催收效率。
圖六
大數(shù)據(jù)對信貸風險管理的影響是巨大的,本文所述的也只是冰山一角。事實上,如果可以逐步建立以大數(shù)據(jù)分析逐步替代個人判斷的新型信貸風險管理架構,圍繞大數(shù)據(jù)分析對信貸風險管理架構進行重組與再造,勢必會能提高金融機構信貸風險管理的有效性,進而平抑信貸不良率波動。因此,如何運用好大數(shù)據(jù)的眾多“功夫”,推動金融信貸的良性發(fā)展,將會一直是今后熱門的話題。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價值、驅動決策的 ...
2025-07-15CDA 精益業(yè)務數(shù)據(jù)分析:驅動企業(yè)高效決策的核心引擎? 在數(shù)字經濟時代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無外鍵關聯(lián)表的 JOIN 實戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫的日常操作中,我們經常會遇到需要整合多張表數(shù)據(jù)的場景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學的瑞士軍刀? ? 在數(shù)據(jù)驅動的時代,面對海量、復雜的數(shù)據(jù),如何高效地進行處理、分析和挖掘成為關鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14t檢驗與Wilcoxon檢驗的選擇:何時用t.test,何時用wilcox.test? t 檢驗與 Wilcoxon 檢驗的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14AI 浪潮下的生存與進階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導白皮書) 發(fā)布機構:CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08