
大數(shù)據(jù)做P2P風(fēng)評(píng)風(fēng)控只是理論可行
中國(guó)P2P平臺(tái)交易規(guī)模的增速,比指數(shù)增長(zhǎng)的陡峭曲線(xiàn)還狂放。據(jù)易觀智庫(kù)數(shù)據(jù)顯示,中國(guó)P2P平臺(tái)交易規(guī)模2011年為96.7億元, 2014年中國(guó)P2P平臺(tái)的交易規(guī)模躍升為2012.6億元,四年間幾乎有了20倍以上的增幅。但隨著市場(chǎng)規(guī)模的擴(kuò)大、參與P2P業(yè)務(wù)的企業(yè)數(shù)量暴增,P2P網(wǎng)貸平臺(tái)的亂象也由此而生,在2013年開(kāi)始出現(xiàn)卷款跑路事件,2014年出現(xiàn)跑路等問(wèn)題的P2P平臺(tái)數(shù)量多達(dá)275家。
雖然從P2P平臺(tái)誕生的那一刻起,幾乎所有的P2P企業(yè)都在說(shuō)風(fēng)控,但事實(shí)上中國(guó)P2P平臺(tái)的風(fēng)控一直在紅色警戒線(xiàn)邊緣。陸金所傳出2.5億元壞賬雖然最終被落實(shí)在Lfex業(yè)務(wù)上,而非之前猜測(cè)的P2P業(yè)務(wù),但讓普通投資者了解到這些P2P平臺(tái)的風(fēng)險(xiǎn)水平已成了燃眉之急,利用大數(shù)據(jù)技術(shù)來(lái)做P2P網(wǎng)貸平臺(tái)風(fēng)險(xiǎn)評(píng)級(jí)和風(fēng)險(xiǎn)控制,已經(jīng)成了行業(yè)繼續(xù)發(fā)展必須邁過(guò)的一道坎。P2P平臺(tái)風(fēng)險(xiǎn)評(píng)級(jí)雖然不去控制風(fēng)險(xiǎn),但可以客觀上反應(yīng)P2P網(wǎng)貸平臺(tái)信用等級(jí)和風(fēng)險(xiǎn)控制能力,對(duì)投資者來(lái)說(shuō)有重要的參加價(jià)值。
孤立封閉的數(shù)據(jù)難以形成大數(shù)據(jù)
5月11日,筆者受邀參加了“中國(guó)P2P網(wǎng)貸平臺(tái)風(fēng)險(xiǎn)評(píng)價(jià)體系專(zhuān)家研討會(huì)”,本次研討會(huì)由理財(cái)魔方(北京口袋財(cái)富信息科技有限公司)、中央財(cái)經(jīng)大學(xué)中國(guó)互聯(lián)網(wǎng)經(jīng)濟(jì)研究院、易觀智庫(kù)共同主辦,目的就是探討用量化的評(píng)價(jià)體系來(lái)評(píng)價(jià)P2P網(wǎng)貸平臺(tái)的風(fēng)險(xiǎn)。
據(jù)該項(xiàng)目執(zhí)行者之一、中央財(cái)經(jīng)大學(xué)互聯(lián)網(wǎng)研究院助理研究員趙宣凱介紹,該P(yáng)2P網(wǎng)貸平臺(tái)風(fēng)險(xiǎn)評(píng)級(jí)體系有三個(gè)特征:第一,主要是從投資者角度出發(fā),幫助用戶(hù)識(shí)別P2P網(wǎng)貸平臺(tái)的風(fēng)險(xiǎn),為投資者選擇哪個(gè)網(wǎng)貸平臺(tái)提供一個(gè)科學(xué)的依據(jù);第二,是以數(shù)據(jù)驅(qū)動(dòng)為核心,通過(guò)理財(cái)魔方獨(dú)有的監(jiān)控引擎獲得大量P2P平臺(tái)數(shù)據(jù),從這些數(shù)據(jù)出發(fā),避免人為打分和設(shè)定權(quán)重所帶來(lái)的主觀臆斷;第三,該評(píng)級(jí)從既有純客觀的統(tǒng)計(jì)方法,還包括主觀判斷為輔,綜合這兩個(gè)方法最終得出P2P網(wǎng)貸平臺(tái)的風(fēng)險(xiǎn)排名。
隨著專(zhuān)家學(xué)者和行業(yè)代表討論的深入,專(zhuān)家們對(duì)利用大數(shù)據(jù)和評(píng)級(jí)模型的探索給與肯定,但也提出了現(xiàn)在整個(gè)大數(shù)據(jù)風(fēng)險(xiǎn)評(píng)級(jí)諸如數(shù)據(jù)采集困難、真實(shí)性和一致性難以保持一致的現(xiàn)實(shí)性問(wèn)題,這不僅是幾家評(píng)級(jí)機(jī)構(gòu)能解決的問(wèn)題,而是整個(gè)P2P行業(yè)需要克服的頑疾。
社科院金融所書(shū)記副所長(zhǎng)何德旭教授在發(fā)言直接指出,社科院也在做P2P網(wǎng)貸平臺(tái)的評(píng)價(jià)體系,主觀評(píng)價(jià)體系和客觀評(píng)價(jià)體系各有優(yōu)缺點(diǎn),但目前用大數(shù)據(jù)做P2P平臺(tái)評(píng)價(jià)體系最大的問(wèn)題就是數(shù)據(jù)。第一,到現(xiàn)在為止近兩千家P2P平臺(tái)的數(shù)據(jù),估計(jì)都拿不到;第二,拿到的數(shù)據(jù)難以保證是不是真實(shí)的;第三,數(shù)據(jù)統(tǒng)計(jì)口徑帶來(lái)的數(shù)據(jù)不一致;第四,指標(biāo)體系的選取和指標(biāo)的賦值要有主觀確定,這會(huì)造成最終結(jié)果的差異性。
利用大數(shù)據(jù)做P2P平臺(tái)風(fēng)險(xiǎn)評(píng)價(jià)體系,理論上來(lái)說(shuō)是非常理想的方法手段,但落實(shí)過(guò)程中需要對(duì)數(shù)據(jù)采集和清洗過(guò)程中會(huì)遇到很多挑戰(zhàn)。尤其是互聯(lián)網(wǎng)金融法律法規(guī)尚未健全的今天,P2P平臺(tái)沒(méi)有義務(wù)向第三方機(jī)構(gòu)或者投資者提供關(guān)鍵的運(yùn)營(yíng)數(shù)據(jù)和重大項(xiàng)目信息披露,第三方機(jī)構(gòu)只能通過(guò)網(wǎng)上輿情監(jiān)控和公開(kāi)交易信息來(lái)獲得所謂的數(shù)據(jù),但這些數(shù)據(jù)通常都按照“報(bào)喜不報(bào)憂(yōu)”的原則被人為修飾和過(guò)濾了,自然也就難以P2P平臺(tái)真實(shí)的運(yùn)營(yíng)情況和風(fēng)險(xiǎn)狀況,基本上只有等到蓋子捂不住了,才會(huì)爆出卷款跑路的新聞,但這時(shí)再去做風(fēng)險(xiǎn)評(píng)估,對(duì)投資者和貸款者都已經(jīng)是為時(shí)已晚。但解決之道要做數(shù)據(jù)鏈的相互比對(duì)和篩選,理財(cái)魔方和易觀在采集數(shù)據(jù)時(shí)會(huì)采用直接采集和向P2P企業(yè)直接咨詢(xún)兩種方式相結(jié)合的方式,盡管目前還無(wú)法約束P2P企業(yè)的吹牛和隱瞞行為,但未來(lái)如果數(shù)據(jù)更豐富、更全面,那么數(shù)據(jù)的可靠性和評(píng)級(jí)的準(zhǔn)確性都有望得到進(jìn)一步提升。
按照理想狀態(tài),大數(shù)據(jù)應(yīng)該是不同企業(yè)、不同部門(mén)共享而成,它可以真實(shí)、動(dòng)態(tài)地反映個(gè)人和企業(yè)的經(jīng)濟(jì)狀況和信用等級(jí),但目前各家企業(yè)對(duì)數(shù)據(jù)都是抱著封閉獨(dú)享的態(tài)度,而且就我觀察,大多數(shù)中小型P2P企業(yè)只有數(shù)據(jù)收集能力,而缺乏數(shù)據(jù)挖掘和利用能力。
在P2P風(fēng)險(xiǎn)控制層面,在之前采訪(fǎng)P2P企業(yè)中談及風(fēng)控,大家都會(huì)不約而同地說(shuō)用大數(shù)據(jù)來(lái)做風(fēng)控,但再去細(xì)問(wèn),大多數(shù)都是語(yǔ)焉不詳,這既有商業(yè)機(jī)密的考量,但我認(rèn)為更重要的原因是大數(shù)據(jù)挖掘的能力不足大致的,大數(shù)據(jù)真正的技術(shù)含量和價(jià)值體現(xiàn)在提取和利用上,而不在于對(duì)數(shù)據(jù)的占有。目前國(guó)內(nèi)的數(shù)據(jù)大多處于獨(dú)立孤島,很難形成由共享而成的數(shù)據(jù)鏈和數(shù)據(jù)網(wǎng),而這恰恰是大數(shù)據(jù)風(fēng)控所需要的。
此次P2P網(wǎng)貸平臺(tái)風(fēng)險(xiǎn)評(píng)價(jià)體系的探索,有可能會(huì)去倒逼評(píng)級(jí)機(jī)構(gòu)盡可能多地去獲取大數(shù)據(jù),甚至用O2O的方式去做數(shù)據(jù)驗(yàn)證和清洗,因?yàn)閿?shù)據(jù)是這個(gè)客觀數(shù)據(jù)評(píng)級(jí)體系的命脈,如果在信息披露和風(fēng)控都相對(duì)規(guī)范的龍頭企業(yè)帶頭,則有可能形成高透明度、高誠(chéng)信企業(yè)自制的局面。
大數(shù)據(jù)風(fēng)險(xiǎn)評(píng)級(jí)到底有沒(méi)有真療效?
利用大數(shù)據(jù)技術(shù)來(lái)做互聯(lián)網(wǎng)金融機(jī)構(gòu)的風(fēng)險(xiǎn)評(píng)級(jí)和風(fēng)險(xiǎn)控制,在理論上幾乎無(wú)爭(zhēng)議,但在實(shí)際行動(dòng)中卻困難重重,大數(shù)據(jù)識(shí)別風(fēng)險(xiǎn)的現(xiàn)實(shí)路徑是否存在?還需要我們付出巨大的努力。
在研討會(huì)上提問(wèn)環(huán)節(jié),我對(duì)利用來(lái)做大數(shù)據(jù)風(fēng)險(xiǎn)評(píng)級(jí)和風(fēng)險(xiǎn)控制的實(shí)現(xiàn)路徑做了兩種路徑猜測(cè),第一是國(guó)家主管部門(mén)利用法律法規(guī)來(lái)強(qiáng)制公開(kāi)P2P平臺(tái)基本的運(yùn)營(yíng)信息,以供金融投資者和貸款者來(lái)作為選擇的依據(jù),另一種是采用市場(chǎng)化的方案,誰(shuí)拿出自己的數(shù)據(jù)來(lái)分享,就可以分享到量級(jí)對(duì)等的其他數(shù)據(jù)源,這有點(diǎn)像過(guò)去電驢和BT下載的P2P機(jī)制類(lèi)似。
當(dāng)向?qū)<姨岢鲞@兩種實(shí)現(xiàn)路徑哪一種近期更有可能實(shí)現(xiàn),從專(zhuān)家們的回答中,我認(rèn)為他們對(duì)這兩種實(shí)現(xiàn)路徑都很審慎。在與一位來(lái)自金融監(jiān)管部門(mén)的專(zhuān)家私下交流時(shí),他指出當(dāng)107號(hào)文件明確了P2P歸屬銀監(jiān)會(huì)監(jiān)管之后,其他有P2P業(yè)務(wù)相關(guān)的部門(mén)都在等待著銀監(jiān)會(huì)出臺(tái)監(jiān)管細(xì)則,以避免與之發(fā)生監(jiān)管規(guī)則上的沖突,而對(duì)于銀監(jiān)會(huì)而言,現(xiàn)在P2P平臺(tái)監(jiān)管還沒(méi)有非常健全和完善的國(guó)際通行標(biāo)準(zhǔn)和規(guī)范,所以其制定過(guò)程也會(huì)相對(duì)謹(jǐn)慎,周期也可能比希望的更長(zhǎng)。
而P2P平臺(tái)對(duì)于信息公開(kāi)和數(shù)據(jù)分享的態(tài)度也是截然不同的,相對(duì)而言一些規(guī)模較大、運(yùn)行相對(duì)規(guī)范的P2P平臺(tái)更愿意分享他們的數(shù)據(jù),這是彰顯實(shí)力的好方法;而另外一些P2P平臺(tái)運(yùn)營(yíng)涉嫌設(shè)立資金池等違規(guī)行為,就會(huì)對(duì)公開(kāi)信息非常抵觸,所以希望P2P企業(yè)自律、自覺(jué)提供真實(shí)數(shù)據(jù),雖然短期看還很難實(shí)現(xiàn),但未來(lái)有可能是一個(gè)趨勢(shì)和方向,誰(shuí)都希望把貸款放在一個(gè)公開(kāi)透明的平臺(tái)。
風(fēng)險(xiǎn)評(píng)級(jí)體系首先要從完善大數(shù)據(jù)機(jī)制開(kāi)始
利用風(fēng)險(xiǎn)評(píng)價(jià)體系來(lái)評(píng)定P2P網(wǎng)貸平臺(tái)的風(fēng)險(xiǎn),從初衷上是值得肯定的。如中國(guó)人民銀行金融研究所李博博士所言,評(píng)級(jí)體系可以借給投資者一雙慧眼,同時(shí)也幫助監(jiān)管者對(duì)市場(chǎng)進(jìn)行梳理,評(píng)級(jí)機(jī)構(gòu)有三個(gè)原則一定要恪守:第一是獨(dú)立,第二是專(zhuān)業(yè),第三是公正。模型和數(shù)據(jù)都可以通過(guò)迭代更新來(lái)不斷優(yōu)化,但P2P網(wǎng)貸評(píng)級(jí)體系的初衷一定要有所堅(jiān)持,方能對(duì)P2P產(chǎn)業(yè)的發(fā)展起到應(yīng)有的促進(jìn)和警示作用。
現(xiàn)在不管是客觀數(shù)據(jù)為主的評(píng)級(jí)體系,還是以專(zhuān)家意見(jiàn)為主的主管評(píng)級(jí)體系,歸根結(jié)底都需要龐大的數(shù)據(jù)鏈來(lái)做做最基本的支撐,否則算法和模型再好,沒(méi)有真實(shí)有效的數(shù)據(jù)也是在做無(wú)用功。
如果要拿一把尺子去做量具,最先要保證的就是這把尺子的刻度精準(zhǔn)。針對(duì)P2P網(wǎng)貸平臺(tái)的評(píng)價(jià)體系也是如此,其評(píng)級(jí)體系必須有輔以科學(xué)、完備的大數(shù)據(jù)采集、清洗、提煉和利用機(jī)制,這也是結(jié)論正確的前提和重要保證。
2015年的中國(guó)P2P網(wǎng)貸平臺(tái)依然火爆,但風(fēng)險(xiǎn)也在逐漸累積,而利用大數(shù)據(jù)進(jìn)行風(fēng)險(xiǎn)評(píng)級(jí)和風(fēng)險(xiǎn)控制的美好愿望盡管理論可行,但在現(xiàn)實(shí)還存在諸多挑戰(zhàn)。但不管阻力和困難有多大,借助大數(shù)據(jù)做風(fēng)險(xiǎn)評(píng)級(jí)和風(fēng)險(xiǎn)控制又是勢(shì)在必行之舉,我們?cè)谡餍艈?wèn)題落下的課必須要補(bǔ)上,這既是在還歷史的欠債,也是在為中國(guó)互聯(lián)網(wǎng)金融的鋪設(shè)未來(lái)之路,既然是繞不過(guò)去的坎,那就直面現(xiàn)實(shí)勇敢應(yīng)對(duì)吧。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過(guò)程中,“損失曲線(xiàn)” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類(lèi)核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語(yǔ)言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話(huà)題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11