
用大數(shù)據(jù)進(jìn)行P2P風(fēng)險評級和風(fēng)控只是理論可行嗎
中國P2P平臺交易規(guī)模的增速,比指數(shù)增長的陡峭曲線還狂放。據(jù)數(shù)據(jù)顯示,中國P2P平臺交易規(guī)模2011年為96.7億元,2014年中國P2P平臺的交易規(guī)模躍升為2012.6億元,四年間幾乎有了20倍以上的增幅。但隨著市場規(guī)模的擴(kuò)大、參與P2P業(yè)務(wù)的企業(yè)數(shù)量暴增,P2P網(wǎng)貸平臺的亂象也由此而生,在2013年開始出現(xiàn)卷款跑路事件,2014年出現(xiàn)跑路等問題的P2P平臺數(shù)量多達(dá)275家。
雖然從P2P平臺誕生的那一刻起,幾乎所有的P2P企業(yè)都在說風(fēng)控,但事實上中國P2P平臺的風(fēng)控一直在紅色警戒線邊緣。陸金所傳出2.5億元壞賬雖然最終被落實在Lfex業(yè)務(wù)上,而非之前猜測的P2P業(yè)務(wù),但讓普通投資者了解到這些P2P平臺的風(fēng)險水平已成了燃眉之急,利用大數(shù)據(jù)技術(shù)來做P2P網(wǎng)貸平臺風(fēng)險評級和風(fēng)險控制,已經(jīng)成了行業(yè)繼續(xù)發(fā)展必須邁過的一道坎。P2P平臺風(fēng)險評級雖然不去控制風(fēng)險,但可以客觀上反應(yīng)P2P網(wǎng)貸平臺信用等級和風(fēng)險控制能力,對投資者來說有重要的參加價值。
孤立封閉的數(shù)據(jù)難以形成大數(shù)據(jù)
5月11日,筆者受邀參加了“中國P2P網(wǎng)貸平臺風(fēng)險評價體系專家研討會”,目的就是探討用量化的評價體系來評價P2P網(wǎng)貸平臺的風(fēng)險。
據(jù)該項目執(zhí)行者之一、中央財經(jīng)大學(xué)互聯(lián)網(wǎng)研究院助理研究員趙宣凱介紹,該P2P網(wǎng)貸平臺風(fēng)險評級體系有三個特征:第一,主要是從投資者角度出發(fā),幫助用戶識別P2P網(wǎng)貸平臺的風(fēng)險,為投資者選擇哪個網(wǎng)貸平臺提供一個科學(xué)的依據(jù);第二,是以數(shù)據(jù)驅(qū)動為核心,通過理財魔方獨有的監(jiān)控引擎獲得大量P2P平臺數(shù)據(jù),從這些數(shù)據(jù)出發(fā),避免人為打分和設(shè)定權(quán)重所帶來的主觀臆斷;第三,該評級從既有純客觀的統(tǒng)計方法,還包括主觀判斷為輔,綜合這兩個方法最終得出P2P網(wǎng)貸平臺的風(fēng)險排名。
隨著專家學(xué)者和行業(yè)代表討論的深入,專家們對利用大數(shù)據(jù)和評級模型的探索給與肯定,但也提出了現(xiàn)在整個大數(shù)據(jù)風(fēng)險評級諸如數(shù)據(jù)采集困難、真實性和一致性難以保持一致的現(xiàn)實性問題,這不僅是幾家評級機(jī)構(gòu)能解決的問題,而是整個P2P行業(yè)需要克服的頑疾。
社科院金融所書記副所長何德旭教授在發(fā)言直接指出,社科院也在做P2P網(wǎng)貸平臺的評價體系,主觀評價體系和客觀評價體系各有優(yōu)缺點,但目前用大數(shù)據(jù)做P2P平臺評價體系最大的問題就是數(shù)據(jù)。第一,到現(xiàn)在為止近兩千家P2P平臺的數(shù)據(jù),估計都拿不到;第二,拿到的數(shù)據(jù)難以保證是不是真實的;第三,數(shù)據(jù)統(tǒng)計口徑帶來的數(shù)據(jù)不一致;第四,指標(biāo)體系的選取和指標(biāo)的賦值要有主觀確定,這會造成最終結(jié)果的差異性。
利用大數(shù)據(jù)做P2P平臺風(fēng)險評價體系,理論上來說是非常理想的方法手段,但落實過程中需要對數(shù)據(jù)采集和清洗過程中會遇到很多挑戰(zhàn)。尤其是互聯(lián)網(wǎng)金融法律法規(guī)尚未健全的今天,P2P平臺沒有義務(wù)向第三方機(jī)構(gòu)或者投資者提供關(guān)鍵的運營數(shù)據(jù)和重大項目信息披露,第三方機(jī)構(gòu)只能通過網(wǎng)上輿情監(jiān)控和公開交易信息來獲得所謂的數(shù)據(jù),但這些數(shù)據(jù)通常都按照“報喜不報憂”的原則被人為修飾和過濾了,自然也就難以P2P平臺真實的運營情況和風(fēng)險狀況,基本上只有等到蓋子捂不住了,才會爆出卷款跑路的新聞,但這時再去做風(fēng)險評估,對投資者和貸款者都已經(jīng)是為時已晚。但解決之道要做數(shù)據(jù)鏈的相互比對和篩選,理財魔方和易觀在采集數(shù)據(jù)時會采用直接采集和向P2P企業(yè)直接咨詢兩種方式相結(jié)合的方式,盡管目前還無法約束P2P企業(yè)的吹牛和隱瞞行為,但未來如果數(shù)據(jù)更豐富、更全面,那么數(shù)據(jù)的可靠性和評級的準(zhǔn)確性都有望得到進(jìn)一步提升。
按照理想狀態(tài),大數(shù)據(jù)應(yīng)該是不同企業(yè)、不同部門共享而成,它可以真實、動態(tài)地反映個人和企業(yè)的經(jīng)濟(jì)狀況和信用等級,但目前各家企業(yè)對數(shù)據(jù)都是抱著封閉獨享的態(tài)度,而且就我觀察,大多數(shù)中小型P2P企業(yè)只有數(shù)據(jù)收集能力,而缺乏數(shù)據(jù)挖掘和利用能力。
在P2P風(fēng)險控制層面,在之前采訪P2P企業(yè)中談及風(fēng)控,大家都會不約而同地說用大數(shù)據(jù)來做風(fēng)控,但再去細(xì)問,大多數(shù)都是語焉不詳,這既有商業(yè)機(jī)密的考量,但我認(rèn)為更重要的原因是大數(shù)據(jù)挖掘的能力不足大致的,大數(shù)據(jù)真正的技術(shù)含量和價值體現(xiàn)在提取和利用上,而不在于對數(shù)據(jù)的占有。目前國內(nèi)的數(shù)據(jù)大多處于獨立孤島,很難形成由共享而成的數(shù)據(jù)鏈和數(shù)據(jù)網(wǎng),而這恰恰是大數(shù)據(jù)風(fēng)控所需要的。
大數(shù)據(jù)風(fēng)險評級到底有沒有真療效?
利用大數(shù)據(jù)技術(shù)來做互聯(lián)網(wǎng)金融機(jī)構(gòu)的風(fēng)險評級和風(fēng)險控制,在理論上幾乎無爭議,但在實際行動中卻困難重重,大數(shù)據(jù)識別風(fēng)險的現(xiàn)實路徑是否存在?還需要我們付出巨大的努力。
在研討會上提問環(huán)節(jié),我對利用來做大數(shù)據(jù)風(fēng)險評級和風(fēng)險控制的實現(xiàn)路徑做了兩種路徑猜測,第一是國家主管部門利用法律法規(guī)來強(qiáng)制公開P2P平臺基本的運營信息,以供金融投資者和貸款者來作為選擇的依據(jù),另一種是采用市場化的方案,誰拿出自己的數(shù)據(jù)來分享,就可以分享到量級對等的其他數(shù)據(jù)源,這有點像過去電驢和BT下載的P2P機(jī)制類似。
當(dāng)向?qū)<姨岢鲞@兩種實現(xiàn)路徑哪一種近期更有可能實現(xiàn),從專家們的回答中,我認(rèn)為他們對這兩種實現(xiàn)路徑都很審慎。在與一位來自金融監(jiān)管部門的專家私下交流時,他指出當(dāng)107號文件明確了P2P歸屬銀監(jiān)會監(jiān)管之后,其他有P2P業(yè)務(wù)相關(guān)的部門都在等待著銀監(jiān)會出臺監(jiān)管細(xì)則,以避免與之發(fā)生監(jiān)管規(guī)則上的沖突,而對于銀監(jiān)會而言,現(xiàn)在P2P平臺監(jiān)管還沒有非常健全和完善的國際通行標(biāo)準(zhǔn)和規(guī)范,所以其制定過程也會相對謹(jǐn)慎,周期也可能比希望的更長。
而P2P平臺對于信息公開和數(shù)據(jù)分享的態(tài)度也是截然不同的,相對而言一些規(guī)模較大、運行相對規(guī)范的P2P平臺更愿意分享他們的數(shù)據(jù),這是彰顯實力的好方法;而另外一些P2P平臺運營涉嫌設(shè)立資金池等違規(guī)行為,就會對公開信息非常抵觸,所以希望P2P企業(yè)自律、自覺提供真實數(shù)據(jù),雖然短期看還很難實現(xiàn),但未來有可能是一個趨勢和方向,誰都希望把貸款放在一個公開透明的平臺。
風(fēng)險評級體系首先要從完善大數(shù)據(jù)機(jī)制開始
利用風(fēng)險評價體系來評定P2P網(wǎng)貸平臺的風(fēng)險,從初衷上是值得肯定的。如中國人民銀行金融研究所李博博士所言,評級體系可以借給投資者一雙慧眼,同時也幫助監(jiān)管者對市場進(jìn)行梳理,評級機(jī)構(gòu)有三個原則一定要恪守:第一是獨立,第二是專業(yè),第三是公正。模型和數(shù)據(jù)都可以通過迭代更新來不斷優(yōu)化,但P2P網(wǎng)貸評級體系的初衷一定要有所堅持,方能對P2P產(chǎn)業(yè)的發(fā)展起到應(yīng)有的促進(jìn)和警示作用。
現(xiàn)在不管是客觀數(shù)據(jù)為主的評級體系,還是以專家意見為主的主管評級體系,歸根結(jié)底都需要龐大的數(shù)據(jù)鏈來做做最基本的支撐,否則算法和模型再好,沒有真實有效的數(shù)據(jù)也是在做無用功。
如果要拿一把尺子去做量具,最先要保證的就是這把尺子的刻度精準(zhǔn)。針對P2P網(wǎng)貸平臺的評價體系也是如此,其評級體系必須有輔以科學(xué)、完備的大數(shù)據(jù)采集、清晰、提煉和利用機(jī)制,這也是結(jié)論正確的前提和重要保證。
2015年的中國P2P網(wǎng)貸平臺依然火爆,但風(fēng)險也在逐漸累積,而利用大數(shù)據(jù)進(jìn)行風(fēng)險評級和風(fēng)險控制的美好愿望盡管理論可行,但在現(xiàn)實還存在諸多挑戰(zhàn)。但不管阻力和困難有多大,借助大數(shù)據(jù)做風(fēng)險評級和風(fēng)險控制又是勢在必行之舉,我們在征信問題落下的課必須要補上,這既是在還歷史的欠債,也是在為中國互聯(lián)網(wǎng)金融的鋪設(shè)未來之路,既然繞不過去,那就直面現(xiàn)實勇敢應(yīng)對吧。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11