
大數(shù)據(jù)背景下的風(fēng)控與征信 專(zhuān)訪中科院院士、北大元培學(xué)院院長(zhǎng)鄂維南教授
訪談:鄂維南,中國(guó)科學(xué)院院士,北大元培學(xué)院院長(zhǎng),普林斯頓大學(xué)數(shù)學(xué)系和應(yīng)用數(shù)學(xué)研究所教授。
大數(shù)據(jù)和大數(shù)據(jù)技術(shù)
王曉蕾(以下簡(jiǎn)稱(chēng)“蕾”):很高興鄂院士在百忙中接受我們的采訪。根據(jù)我的初步理解,目前大數(shù)據(jù)在金融中的運(yùn)用,主要是通過(guò)大數(shù)據(jù)做風(fēng)險(xiǎn)控制,建立風(fēng)險(xiǎn)模型預(yù)測(cè)還款可能性,從而決定授信額度和定價(jià)。您怎樣看待大數(shù)據(jù)在風(fēng)險(xiǎn)管理中的應(yīng)用?
鄂維南(以下簡(jiǎn)稱(chēng)“鄂”):要講清楚這個(gè)問(wèn)題,我們首先要區(qū)別一些概念,首先是大數(shù)據(jù)和大數(shù)據(jù)技術(shù),前者是指的數(shù)據(jù)及可用于風(fēng)險(xiǎn)管理的數(shù)據(jù)問(wèn)題,后者是指一些諸如機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)等大數(shù)據(jù)算法。
從數(shù)據(jù)源的角度,我認(rèn)為,與個(gè)人有關(guān)的信息從外到里可以分為三層:第一圈是關(guān)于個(gè)人的所有信息,第二圈是關(guān)于個(gè)人的所有履約信息,第三圈是信貸履約的信息。在之前傳統(tǒng)的風(fēng)控中,我們一般利用最里圈的信貸履約信息,加上部分個(gè)人基本信息等來(lái)預(yù)測(cè)信貸違(履)約情況。隨著互聯(lián)網(wǎng)和信息技術(shù)的發(fā)展,部分方便可得的外圈信息,對(duì)于內(nèi)圈的履約預(yù)測(cè)慢慢地被證明有一定的效果,例如打車(chē)的履約情況對(duì)信貸履約的判斷是一個(gè)依據(jù),因此大數(shù)據(jù)風(fēng)控隨之逐漸興起。但對(duì)于不同圈別數(shù)據(jù)的跨圈使用,特別是外圈數(shù)據(jù)往內(nèi)圈使用的過(guò)程中,要特別解決法理約束和本人授權(quán)兩個(gè)問(wèn)題,這樣有利于各種數(shù)據(jù)在風(fēng)險(xiǎn)評(píng)估領(lǐng)域中的可持續(xù)使用。
王:您這樣說(shuō)非常清楚。目前,部分放貸機(jī)構(gòu)對(duì)替代性數(shù)據(jù)(Alternative Data)的使用,我的理解就是對(duì)非現(xiàn)金化的債務(wù)履約信息的使用。當(dāng)消費(fèi)者缺乏信貸債務(wù)及其履約信息時(shí),可以利用這些水電煤等先消費(fèi)后付款的信息,通過(guò)考察消費(fèi)者的重復(fù)履約意愿和能力來(lái)進(jìn)行信貸風(fēng)險(xiǎn)管理。我們熟知的美國(guó)澤斯塔(ZestFinance)金融公司,所使用的“替代性”數(shù)據(jù)主要包括水電燃?xì)赓M(fèi)等先消費(fèi)后付款消費(fèi)信息,當(dāng)然,信息主體本人授權(quán)是一個(gè)基本原則。
鄂:以上說(shuō)的是大數(shù)據(jù)問(wèn)題,再?gòu)拇髷?shù)據(jù)技術(shù)角度來(lái)看,任何大數(shù)據(jù)方法用于信用風(fēng)險(xiǎn)的評(píng)估,要滿足三個(gè)條件:一是明確的,對(duì)評(píng)分建模的方法論、過(guò)程和數(shù)據(jù)使用上是明確的,對(duì)監(jiān)管、對(duì)公眾是應(yīng)該公開(kāi)的:二是準(zhǔn)確的,建立的模型要對(duì)不同風(fēng)險(xiǎn)狀況的人群有區(qū)分能力和排序能力;三是穩(wěn)定的,數(shù)據(jù)、方法和模型在人群、時(shí)間跨度上是穩(wěn)定的。從傳統(tǒng)的邏輯回歸,到決策樹(shù),再到機(jī)器學(xué)習(xí)等大數(shù)據(jù)方法的使用,要始終堅(jiān)持開(kāi)發(fā)出來(lái)的模型“明確、準(zhǔn)確和穩(wěn)定”的三大特點(diǎn)。
王:據(jù)我了解,有些利用大數(shù)據(jù)中的機(jī)器學(xué)習(xí)技術(shù)開(kāi)發(fā)的模型是明確的,有些是不明確的。
鄂:是的??傮w而言,對(duì)于大數(shù)據(jù)和大數(shù)據(jù)技術(shù),目前,在風(fēng)險(xiǎn)控制中,可以是在遵守一定規(guī)則上開(kāi)放性使用,但是對(duì)于征信領(lǐng)域,在數(shù)據(jù)的來(lái)源上建議適當(dāng)保守些,這主要是征信對(duì)評(píng)分開(kāi)發(fā)模型的明確性要求更高。但是盡管如此,在數(shù)據(jù)的處理方法上,都可以進(jìn)行不同的嘗試和探索,因?yàn)榇髷?shù)據(jù)技術(shù)的發(fā)展,就是將可以使用的信息,包括傳統(tǒng)的信息和現(xiàn)實(shí)生活中映射到互聯(lián)網(wǎng)的各種信息極大的簡(jiǎn)化為一個(gè)分?jǐn)?shù),供放貸機(jī)構(gòu)高效、便捷的使用。
風(fēng)控與征信之異同
王:按照您剛才說(shuō)的,我理解是,一些熱門(mén)的大數(shù)據(jù)技術(shù)可以做風(fēng)控、但不能做征信,為什么這么說(shuō)呢?
鄂:要理解這個(gè)觀點(diǎn),得先從風(fēng)控和征信的本質(zhì)特征出發(fā)來(lái)看。我們知道風(fēng)控是放貸機(jī)構(gòu)自己的事情,而征信則是第三方機(jī)構(gòu)的信息服務(wù),后者是為前者的風(fēng)控服務(wù)的,對(duì)于信息的使用及其借款人對(duì)信息的知情權(quán)等方面,兩者是有根本性的區(qū)別的。所以我剛才講了,大數(shù)據(jù)技術(shù)開(kāi)發(fā)的評(píng)分模型可以滿足準(zhǔn)確、穩(wěn)定的要求,但是在明確、可解釋性方面,尚待市場(chǎng)的檢驗(yàn)。
放貸機(jī)構(gòu)為了風(fēng)控,可以竭盡所能地收集各類(lèi)或真實(shí)的信息或待證實(shí)的噪音,且對(duì)借款人作的放貸決策也是完全基于自己的商業(yè)目的考慮。但是,征信機(jī)構(gòu)對(duì)信息的收集、加工和對(duì)外提供,則是完全按照市場(chǎng)和放貸機(jī)構(gòu)認(rèn)可、信息主體知情的方式進(jìn)行,征信機(jī)構(gòu)向放貸機(jī)構(gòu)提供的所有針對(duì)借款人個(gè)人的信息,如基礎(chǔ)性的信用報(bào)告,是基于基本客觀事實(shí)的匯總,經(jīng)得起借款人本人質(zhì)疑、挑戰(zhàn)的,信用報(bào)告的內(nèi)容、流程、流轉(zhuǎn)過(guò)程和使用判斷是受到監(jiān)管的。
此外,我知道美國(guó)的征信機(jī)構(gòu)一般是先提供了經(jīng)得起檢驗(yàn)的信用報(bào)告,為信息主體本人提供信用報(bào)告查詢服務(wù)之后,再提供基于信用報(bào)告標(biāo)準(zhǔn)化解讀的各類(lèi)信用評(píng)分服務(wù),我想也是有這樣一個(gè)明確性要求在里面。為了確保個(gè)人信息沒(méi)有被濫用,評(píng)分流程的基本方法、理念、結(jié)果是需要對(duì)外披露,并接受監(jiān)管部門(mén)的全程監(jiān)管的。特別是當(dāng)放貸機(jī)構(gòu)基于征信機(jī)構(gòu)的服務(wù)(如信用報(bào)告、個(gè)人信用評(píng)分),做出了不利于借款人的決策時(shí),如拒絕借貸、提高費(fèi)率、降低額度等,消費(fèi)者是有知情權(quán)的。
王:非常贊成您的觀點(diǎn),保護(hù)借款人(即信息主體)對(duì)征信系統(tǒng)本身及其本人信息被采集使用情況的知情,是征信行業(yè)的國(guó)際慣例,也是保證第三方征信機(jī)構(gòu)獨(dú)立、可信賴(lài)地位的基石。
鄂:是的。在大數(shù)據(jù)的背景下,各種可以預(yù)測(cè)違約的數(shù)據(jù)在豐富性、廣度和深度上出現(xiàn)了極大的增加,但是對(duì)大數(shù)據(jù)的使用不會(huì)也不應(yīng)該動(dòng)搖剛才提到的征信與風(fēng)控間的基本框架。例如,一些大型互聯(lián)網(wǎng)公司,掌握了大量的個(gè)人互聯(lián)網(wǎng)行為信息,這些信息可以用于公司內(nèi)部的風(fēng)險(xiǎn)管理和放貸決策,但是如果一旦用于第三方征信,則相關(guān)互聯(lián)網(wǎng)信息的使用和對(duì)外提供,必須經(jīng)受技術(shù)、用戶、法律、認(rèn)知等社會(huì)方方面面的考驗(yàn),滿足公平公正合法等基本要求。
王:但是我們目前這方面的法律規(guī)定還不太完善。
鄂:沒(méi)有法律規(guī)定也不一定是可以為之的,征信機(jī)構(gòu)的活動(dòng)涉及消費(fèi)者的切身利益,如果因?yàn)檎餍艡C(jī)構(gòu)的服務(wù),如提供了消費(fèi)者不知情或認(rèn)為不準(zhǔn)確的信息,導(dǎo)致消費(fèi)者的金融消費(fèi),如放貸、車(chē)貸等受阻,我認(rèn)為消費(fèi)者也是有權(quán)告第三方征信機(jī)構(gòu)的。征信不是鬧著玩的,不建議目前部分機(jī)構(gòu)采取抱著試試看的態(tài)度,來(lái)看哪些數(shù)據(jù)和技術(shù)可用于風(fēng)險(xiǎn)評(píng)估,并遞延到征信服務(wù)上,有些事情要事先考慮清楚。
王:在大數(shù)據(jù)時(shí)代,征信機(jī)構(gòu)利用大數(shù)據(jù)技術(shù)對(duì)借款人風(fēng)險(xiǎn)水平的預(yù)測(cè)模型,如果經(jīng)過(guò)市場(chǎng)檢驗(yàn)是有效的情況呢?
鄂:這是另一個(gè)問(wèn)題,即便是對(duì)一群人的模型預(yù)測(cè)有效,但是用不成熟、不被大家接受的新技術(shù)和新方法,對(duì)個(gè)人進(jìn)行風(fēng)險(xiǎn)預(yù)測(cè)并給個(gè)人的經(jīng)濟(jì)生活帶來(lái)影響,征信機(jī)構(gòu)也有被司法起訴的風(fēng)險(xiǎn),包括美國(guó)費(fèi)埃哲(FICO)公司當(dāng)時(shí)也是這樣的,模型和技術(shù)要有可解釋性,符合社會(huì)公眾的可接受度,這樣才能站得住腳。從有效性角度來(lái)看,社交網(wǎng)絡(luò)信息對(duì)于營(yíng)銷(xiāo)、對(duì)于反恐等被證明是有效的,但是對(duì)于征信的有效性,還是一個(gè)有待證明的另一個(gè)問(wèn)題。
王:大數(shù)據(jù)在風(fēng)控運(yùn)用上的一些創(chuàng)新確實(shí)存在,例如,傳統(tǒng)上主要是利用信用信息、財(cái)產(chǎn)信息來(lái)預(yù)測(cè)違約,目前依托信息和技術(shù)進(jìn)行了一些創(chuàng)新,如有機(jī)構(gòu)發(fā)現(xiàn)借款人手機(jī)的被叫時(shí)長(zhǎng)、朋友圈的信息和違約有一定的關(guān)系,而將這些變量作為預(yù)測(cè)變量入模分析。
鄂:您說(shuō)的可能是某個(gè)機(jī)構(gòu)根據(jù)某些信息得出的一個(gè)初步結(jié)論,可能會(huì)被常識(shí)支持,但是這僅僅是一些數(shù)據(jù)環(huán)境下的一個(gè)判斷,是否經(jīng)得起檢驗(yàn)、站得住腳,我認(rèn)為還不能過(guò)早下結(jié)論。即便有效,我還是那個(gè)觀點(diǎn),這個(gè)結(jié)論可以被放貸機(jī)構(gòu)的風(fēng)控所用,但是否可為征信機(jī)構(gòu)所用,還用待觀察。
王:就我們而言,征信系統(tǒng)一是收集放貸機(jī)構(gòu)等無(wú)論怎么努力也基本得不到的信息,如借款人在另一家放貸機(jī)構(gòu)的借款信息,之后供放貸機(jī)構(gòu)共享,二是收集放貸機(jī)構(gòu)等可以采集但是成本較高的信息,如法院判決信息,方法是統(tǒng)一采集、大家共用。征信系統(tǒng)提供的以上兩部分信息都是放貸機(jī)構(gòu)的外部信息一部分,放貸機(jī)構(gòu)風(fēng)控所使用的信息一定遠(yuǎn)遠(yuǎn)超過(guò)征信機(jī)構(gòu)提供的信息。
鄂:是的,征信機(jī)構(gòu)的信息永遠(yuǎn)是放貸機(jī)構(gòu)風(fēng)控的一個(gè)重要信息和工具的來(lái)源。其實(shí),目前使用大數(shù)據(jù)模型中,我認(rèn)為很多變量是用來(lái)驗(yàn)證信息的真?zhèn)蔚模?,預(yù)測(cè)違約率還是用傳統(tǒng)的信貸信息一些核心變量,目前來(lái)看,預(yù)測(cè)未來(lái)履約的信息范圍和方法論并沒(méi)有真正擴(kuò)大和突破。
王:非常感謝您的交流。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱(chēng) BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專(zhuān)注于從單 ...
2025-07-09year_month數(shù)據(jù)類(lèi)型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類(lèi)型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專(zhuān)業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03