
互金時(shí)代大數(shù)據(jù)在貸后管理中的應(yīng)用
在互聯(lián)網(wǎng)金融時(shí)代,無論是傳統(tǒng)商業(yè)銀行還是新興的互聯(lián)網(wǎng)金融公司,面臨的風(fēng)險(xiǎn)和挑戰(zhàn)日益增加。在這種情況下,如何利用大數(shù)據(jù)技術(shù)及時(shí)有效地防堵各類信貸風(fēng)險(xiǎn),也一直是各界關(guān)注的熱點(diǎn)問題。大數(shù)據(jù)技術(shù)可以讓貸后管理變得更簡(jiǎn)單嗎?這篇來自“朝陽35處”的文章,將著重講解這方面的應(yīng)用。
個(gè)人信貸不良資產(chǎn)管理壓力增大,貸后管理成管控重點(diǎn)
近年來,隨著我國個(gè)人信貸市場(chǎng)業(yè)務(wù)規(guī)模快速增長(zhǎng),個(gè)人不良貸款余額和不良率不斷走高也成為困擾金融信貸機(jī)構(gòu)的首要問題。以銀行個(gè)人信貸業(yè)務(wù)為例(如圖1所示),其2015年第二季度不良貸款余額已達(dá)到1.18萬億元,不良貸款率也達(dá)到1.6%。
圖一
相比于銀行,互聯(lián)網(wǎng)金融平臺(tái)不良資產(chǎn)的問題和難點(diǎn)則更加凸顯。陸金所董事長(zhǎng)兼CEO 計(jì)葵生年初曾對(duì)媒體表示,網(wǎng)貸行業(yè)平均不良率高達(dá)13%-17%。相對(duì)于傳統(tǒng)金融機(jī)構(gòu),互聯(lián)網(wǎng)網(wǎng)貸行業(yè)平均不良率明顯更高。
面對(duì)這一嚴(yán)峻形勢(shì),不良資產(chǎn)的管理能力逐漸成為金融信貸機(jī)構(gòu)關(guān)注的重點(diǎn)領(lǐng)域。
不良資產(chǎn)管控的核心有兩大方面,一是控制不良資產(chǎn)新增,二是化解存量不良資產(chǎn)??刂撇涣假Y產(chǎn)新增的有效手段是在“貸前”階段建立完善風(fēng)險(xiǎn)管理措施,嚴(yán)格把控客戶準(zhǔn)入門檻。
而化解存量不良資產(chǎn)的核心則是“貸后管理”。
所謂貸后管理,主要內(nèi)容是對(duì)不良資產(chǎn)進(jìn)行有效評(píng)估,并以此為基礎(chǔ)對(duì)客戶進(jìn)行分群,輔以失聯(lián)修復(fù)手段,對(duì)不同客群采取差異化的催收策略。
貸后管理是不良資產(chǎn)管控的重點(diǎn),而失聯(lián)修復(fù)則是化解存量不良資產(chǎn)的先決條件。
以貸后管理中的催收為例,現(xiàn)階段催收人員只能通過借貸人申請(qǐng)貸款時(shí)留下的三到五個(gè)關(guān)聯(lián)號(hào)碼和其進(jìn)行聯(lián)系。如果借貸人當(dāng)時(shí)本就無心償還貸款,已有號(hào)碼有效率會(huì)非常低。就現(xiàn)在的國內(nèi)個(gè)人信貸市場(chǎng)而言,新客戶中失聯(lián)比例達(dá)到30%~50%,而在進(jìn)入不良階段后,客戶失聯(lián)比例高達(dá)70%。
這時(shí),對(duì)大部分商業(yè)銀行和互聯(lián)網(wǎng)金融公司而言,只使用貸款人當(dāng)時(shí)提供的聯(lián)系方式使貸后催收變得困難,需要尋求外部數(shù)據(jù)的支持協(xié)助。只有在結(jié)合外部數(shù)據(jù)對(duì)失聯(lián)客戶進(jìn)行信息修復(fù),可以很大程度上幫助催收部門和客戶重新取得聯(lián)系,從而化解存量不良資產(chǎn)。
然而,在初步修復(fù)客戶信息后,新的問題出現(xiàn)了。一種經(jīng)常出現(xiàn)的情況是,與客戶有關(guān)聯(lián)的聯(lián)系人過多,有些客戶的聯(lián)系人可以多達(dá)幾十個(gè)甚至上百個(gè)。這又給催收人員帶來了另一種窘境,在面對(duì)過多的電話號(hào)碼,如果一個(gè)個(gè)撥打,不僅耗時(shí)耗力更不符合實(shí)際情況。即使手上掌握了欠款客戶充足的信息,但如果聯(lián)系號(hào)碼數(shù)量巨大,則修復(fù)率并不能夠被保證。
大數(shù)據(jù)模型助力提升失聯(lián)修復(fù)率
下面我們來舉例說明,利用大數(shù)據(jù)篩選模型,如何解決客戶聯(lián)系人號(hào)碼過多的問題。首先我們需要建立一個(gè)模型來對(duì)眾多號(hào)碼修復(fù)的成功率進(jìn)行預(yù)測(cè),從而通過篩選或排序,使催收人員可以從最可靠的號(hào)碼開始聯(lián)系客戶。
我們可以先選取小規(guī)模的數(shù)據(jù)集進(jìn)行研究。比如,我們抽樣選取了9000多個(gè)聯(lián)系人的數(shù)據(jù),每組數(shù)據(jù)包括聯(lián)系人的電話號(hào)碼,對(duì)應(yīng)的數(shù)據(jù)來源,電話更新時(shí)間以及是否有效修復(fù)失聯(lián)的標(biāo)簽。其中,能夠修復(fù)失聯(lián)的定義為:電話號(hào)碼是有效可以撥通,且聯(lián)系人表示認(rèn)識(shí)并愿意轉(zhuǎn)告客戶,積極提供客戶信息;而空號(hào),不可撥通,聯(lián)系人態(tài)度差,表示不認(rèn)識(shí),或者認(rèn)識(shí)客戶但不愿意聯(lián)系客戶的電話號(hào)碼則為無效。
這9000個(gè)樣本聯(lián)系人號(hào)碼在數(shù)億量級(jí)的全量數(shù)據(jù)庫中,與其他聯(lián)系人號(hào)碼通過各種關(guān)系形成了一個(gè)個(gè)網(wǎng)絡(luò)。如圖二所示,一個(gè)節(jié)點(diǎn)代表一個(gè)聯(lián)系人的電話號(hào)碼,而兩點(diǎn)之間的邊則代表這兩個(gè)電話號(hào)碼之間存在某種關(guān)系。每個(gè)節(jié)點(diǎn)的自由度定義為與這個(gè)節(jié)點(diǎn)相連的邊的數(shù)目。通過分析網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)的自由度,我們可以進(jìn)一步得知與每個(gè)號(hào)碼有聯(lián)系的號(hào)碼個(gè)數(shù)。以節(jié)點(diǎn)1為例,該電話號(hào)碼與4個(gè)號(hào)碼有聯(lián)系,它的自由度為4;節(jié)點(diǎn)2的自由度為3。節(jié)點(diǎn)的自由度越高,代表持有該號(hào)碼的人的社交圈子越大。
圖二
1.使用單變量分析
首先我們用單變量分析的方法看一下節(jié)點(diǎn)自由度、更新時(shí)間以及不同數(shù)據(jù)源對(duì)失聯(lián)修復(fù)率的影響。圖三顯示了節(jié)點(diǎn)自由度與失聯(lián)修復(fù)率的關(guān)系。當(dāng)節(jié)點(diǎn)自由度為1時(shí),失聯(lián)修復(fù)率最低,只有14%。隨著節(jié)點(diǎn)自由度的增大,失聯(lián)修復(fù)率也隨之提高。當(dāng)節(jié)點(diǎn)自由度為3時(shí),失聯(lián)修復(fù)率達(dá)到極值24%。隨后,失聯(lián)修復(fù)率隨節(jié)點(diǎn)自由度的增大而降低。
圖三
圖四顯示了電話號(hào)碼更新時(shí)間與失聯(lián)修復(fù)率的關(guān)系。由圖可見,失聯(lián)修復(fù)所使用的信息幾乎99%都來源于最近四年的數(shù)據(jù)。其中,2014年更新的數(shù)據(jù)失聯(lián)修復(fù)率最高,達(dá)到18%,而2015年更新的數(shù)據(jù)失聯(lián)修復(fù)率最低,只有11%。
圖四
圖五顯示了不同數(shù)據(jù)源與失聯(lián)修復(fù)率的關(guān)系。我們整合了九個(gè)不同的內(nèi)、外部數(shù)據(jù)源,所有的數(shù)據(jù)源均有用戶授權(quán)。為了保護(hù)商業(yè)機(jī)密,我們不對(duì)數(shù)據(jù)源進(jìn)行公布。但可以看到的是,數(shù)據(jù)源2、3和4的失聯(lián)修復(fù)率最佳,均可達(dá)到20%,而數(shù)據(jù)源7表現(xiàn)最差,只有10%的失聯(lián)修復(fù)率。
圖五
2.使用機(jī)器學(xué)習(xí)模型
上述的單變量分析只能統(tǒng)計(jì)單個(gè)變量對(duì)失聯(lián)修復(fù)率的影響,如果這些變量相互獨(dú)立,我們可以通過簡(jiǎn)單的乘法公式計(jì)算出這些變量聯(lián)合起來對(duì)失聯(lián)修復(fù)率的影響。然而,這些變量顯然不是相互獨(dú)立的,而是彼此關(guān)聯(lián)的。例如,對(duì)于數(shù)據(jù)源1,當(dāng)電話號(hào)碼的更新時(shí)間為2014年時(shí),失聯(lián)修復(fù)率最高;而對(duì)于另外一個(gè)數(shù)據(jù)源,當(dāng)電話號(hào)碼的更新時(shí)間為2016年時(shí),失聯(lián)修復(fù)率最高。
為了分析這些相互關(guān)聯(lián)的變量聯(lián)合起來對(duì)失聯(lián)修復(fù)率的影響,我們采用Gradient Boosting非參數(shù)模型進(jìn)行建模,來預(yù)測(cè)某個(gè)號(hào)碼失聯(lián)修復(fù)的概率。為了驗(yàn)證模型效果,我們將數(shù)據(jù)集進(jìn)行拆分,其中訓(xùn)練集大小為6000,而測(cè)試集大小為3000。
在訓(xùn)練集上訓(xùn)練好模型之后,其在測(cè)試集上的表現(xiàn)如圖六所示。修復(fù)概率排名前10%的號(hào)碼的失聯(lián)修復(fù)率為28.1%,這相對(duì)于整個(gè)數(shù)據(jù)源15.3%的平均修復(fù)率,提升達(dá)到了83%!這種優(yōu)化帶來的收益非常明顯,如果與某客戶相關(guān)聯(lián)的聯(lián)系人號(hào)碼超過十個(gè)甚至上百個(gè),通過上述方式的篩選則可以得到五到六個(gè)質(zhì)量較高的聯(lián)系人號(hào)碼,使得催收人員輕松有效地找到失聯(lián)客戶;如果一個(gè)失聯(lián)客戶聯(lián)系人數(shù)目較少,催收人員也可以按照大數(shù)據(jù)模型給出的電話號(hào)碼靠譜程度排序,從高到低進(jìn)行撥打,從而更快找到失聯(lián)客戶,顯著提升催收效率。
圖六
大數(shù)據(jù)對(duì)信貸風(fēng)險(xiǎn)管理的影響是巨大的,本文所述的也只是冰山一角。事實(shí)上,如果可以逐步建立以大數(shù)據(jù)分析逐步替代個(gè)人判斷的新型信貸風(fēng)險(xiǎn)管理架構(gòu),圍繞大數(shù)據(jù)分析對(duì)信貸風(fēng)險(xiǎn)管理架構(gòu)進(jìn)行重組與再造,勢(shì)必會(huì)能提高金融機(jī)構(gòu)信貸風(fēng)險(xiǎn)管理的有效性,進(jìn)而平抑信貸不良率波動(dòng)。因此,如何運(yùn)用好大數(shù)據(jù)的眾多“功夫”,推動(dòng)金融信貸的良性發(fā)展,將會(huì)一直是今后熱門的話題。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11