
銀行與互金,誰的大數(shù)據(jù)更厲害
“銀行的大數(shù)據(jù)和互金的大數(shù)據(jù)應(yīng)用有沒有什么不同?”的確,說到金融大數(shù)據(jù),我們會發(fā)現(xiàn)有兩類機構(gòu)都在提,當(dāng)互聯(lián)網(wǎng)金融企業(yè)都把大數(shù)據(jù)掛在嘴邊、當(dāng)大數(shù)據(jù)風(fēng)控成為新金融的代表性模式時,被稱作“傳統(tǒng)金融機構(gòu)”的銀行業(yè)也坐不住了,站出來講,銀行業(yè)才是典型的大數(shù)據(jù)企業(yè),銀行內(nèi)部有大量的數(shù)據(jù),既有結(jié)構(gòu)性數(shù)據(jù),也有非結(jié)構(gòu)性數(shù)據(jù),只是沒有把這個數(shù)據(jù)富礦更好地利用罷了。
所以,問題就來了。銀行與互金,所講的大數(shù)據(jù)是一回事嗎?二者究竟有何區(qū)別呢?
差異始于自有數(shù)據(jù)的不同
對于任何一類機構(gòu)而言,其數(shù)據(jù)的構(gòu)成都是自有數(shù)據(jù)+外部數(shù)據(jù),外部數(shù)據(jù)則包括既公開數(shù)據(jù),也包括第三方購買數(shù)據(jù)和其他渠道獲得的數(shù)據(jù),如下圖所示。照理來講,外部數(shù)據(jù)的獲取是可以做到大致相似的,自有數(shù)據(jù)便構(gòu)成了金融機構(gòu)數(shù)據(jù)差異化的基礎(chǔ)。
先來看看銀行業(yè)
本質(zhì)上,整個銀行業(yè)的一切活動和產(chǎn)品都是與數(shù)據(jù)有關(guān)的,甚至說銀行的所有產(chǎn)品都是數(shù)據(jù)也不為過,比如說你的存款、你的貸款、你的理財產(chǎn)品等,實際上就是在銀行系統(tǒng)內(nèi)記錄的一組數(shù)據(jù)而已。正是由于銀行產(chǎn)品和業(yè)務(wù)的天然數(shù)據(jù)屬性,所以銀行業(yè)在產(chǎn)生數(shù)據(jù)和應(yīng)用數(shù)據(jù)方面一直走在各行各業(yè)的前列。據(jù)悉,計算機由軍用轉(zhuǎn)為民用時,率先利用計算機技術(shù)來提升行業(yè)管理能力和發(fā)展能力的就是銀行業(yè)。
銀行的自有數(shù)據(jù)主要是各種業(yè)務(wù)數(shù)據(jù),是對全行客戶業(yè)務(wù)活動過程和結(jié)果的記錄。同時,為了更好地開展業(yè)務(wù),還會要求用戶提供諸如電話、職業(yè)、教育、住址等信息,如果有過貸款申請行為,還會包括收入、房產(chǎn)等強信用屬性數(shù)據(jù)。此外,所有人的工資都是銀行代發(fā),公積金流水也在銀行,房貸和車貸也都在銀行,銀行在業(yè)務(wù)過程中還產(chǎn)生了大量的文檔、資訊、圖片、音像等非結(jié)構(gòu)化數(shù)據(jù)。
換個角度來看,銀行賬戶是經(jīng)濟社會所有活動的起點和重點,所有人的財富狀況和變動情況都會在銀行留有痕跡,所以,要判斷一個人有錢沒錢,找銀行就對了。為何保險產(chǎn)品、基金產(chǎn)品都喜歡交給銀行來銷售,一方面是銀行有著龐大的線下渠道,更重要的在于,銀行知道哪些用戶有錢,從而進行更好的產(chǎn)品匹配銷售。
本質(zhì)上講,若能精準地判斷一個人有錢沒錢、有多少錢,無論是進行精準營銷還是風(fēng)險防控,基本也不太需要太多的其他數(shù)據(jù)了。但問題在于,銀行業(yè)的數(shù)據(jù)是割裂的,除了信貸類的關(guān)鍵信息會以征信的形式報送央行征信中心,實現(xiàn)一定程度上的共享外,其他的各類財富相關(guān)數(shù)據(jù),都分別沉淀在各家銀行。比如張三,在中國銀行有1000塊存款,在建設(shè)銀行有20萬塊存款,在工商銀行沒有存款,那么,在建行看來,這是個有錢人;在中行看來,這是個再普通不過的用戶,在工行看來,這個人的財富狀況無法判斷。
再來看看互金平臺
如果是創(chuàng)業(yè)型互金平臺,其自有數(shù)據(jù)也主要是各類業(yè)務(wù)數(shù)據(jù),這點與銀行相似,不過數(shù)據(jù)量要少得多,受單一的業(yè)務(wù)模式制約,數(shù)據(jù)維度也很單一,單靠其自有數(shù)據(jù),是幾乎談不上什么大數(shù)據(jù)應(yīng)用的。而幾大互金巨頭就不同了,比如BAT,其本身就是互聯(lián)網(wǎng)時代的數(shù)據(jù)黑洞,沉淀了巨量的用戶數(shù)據(jù),當(dāng)其轉(zhuǎn)型做金融時,之前積累的電商數(shù)據(jù)、社交數(shù)據(jù)、行為數(shù)據(jù)等便成為其可用的自有數(shù)據(jù)。當(dāng)然,互金巨頭對用戶財富數(shù)據(jù)的掌握程度遠遠比不上銀行,不過 好在銀行最有價值的金融數(shù)據(jù)——信貸數(shù)據(jù)已經(jīng)在征信中心實現(xiàn)了共享。
金融數(shù)據(jù)的日月星辰之光
數(shù)據(jù)的多少或優(yōu)劣,只能通過其對業(yè)務(wù)的促進作用來進行比較,我們以信貸業(yè)務(wù)為例進行分析。不考慮房產(chǎn)抵押、存款質(zhì)押、理財質(zhì)押等抵質(zhì)押類貸款產(chǎn)品,從純信用類的消費貸款產(chǎn)品來看,排除欺詐風(fēng)險的因素,大數(shù)據(jù)風(fēng)控要解決的是核心問題是:一個人的還款意愿、還款能力、還款穩(wěn)定性等因素。判斷這些因素,這個人的信貸行為數(shù)據(jù)、歷史借款數(shù)據(jù)、歷史違約信息等征信類信息是最有效的數(shù)據(jù),我們可以從FICO分的構(gòu)成進行驗證。
FICO(Fair Isaac Company)信用分是由美國個人消費信用評估公司開發(fā)出的一種個人信用評級法,其分值在300-850之間,已經(jīng)得到社會廣泛接受。據(jù)一項統(tǒng)計顯示,信用分低于600分,借款人違約的比例是1/8,信用分介于700~800分,違約率為1/123,信用分高于800分,違約率為1/1292。一般認為,F(xiàn)ICO分高于680分,就屬于信用卓著的用戶了;而若低于620分,則很可能被拒貸,或被要求增加擔(dān)保或抵質(zhì)押。
而FICO評分模型主要就是圍繞個人的歷史借貸行為等征信類信息展開的,包括付款歷史(占比35%左右,包括各類信用/貸款賬戶的還款記錄,公開記錄即支票存款記錄,逾期償還情況等)、未嘗債務(wù)(占比約30%,包括仍需償還的信用賬戶總數(shù),信用賬戶余額,總額度使用率等)、信貸時長(占比約15%,信貸賬戶的賬齡)、新開立信用賬戶(占比10%,包括新開立信用賬戶數(shù),新開里賬戶賬齡,正在申請的信用賬戶數(shù)量,查詢查詢記錄等),正在使用的信貸組合(占比10%左右,包括信用卡賬戶、零售賬戶、分期付款賬戶、抵押貸款賬戶等混合使用情況)。
從效用等級來看,記錄歷史借款數(shù)據(jù)的征信數(shù)據(jù)有效性最強,可看作是太陽之光;消費、社交等數(shù)據(jù)的有效性次之,可看作月亮之光;興趣愛好及其他行為數(shù)據(jù)的有效性再次之,可看作星辰之光。在評價一個人的信用時,如果這個人有征信數(shù)據(jù),那么基本可以不用再看消費、社交、興趣等等其他數(shù)據(jù)就可以進行判斷,就像太陽一出,月亮和星辰之光便黯淡無色了。
問題在于,大多數(shù)的人都缺乏有效的征信數(shù)據(jù),中國13億人口中,有信貸征信記錄的僅有3.5億。對于沒有征信記錄的人,只能用月亮星辰之光進行信用判斷,雖然效用差一些,但很多情況下也勉強可用,這是互聯(lián)網(wǎng)大數(shù)據(jù)風(fēng)控模型崛起的內(nèi)在邏輯。
銀行與互金大數(shù)據(jù)風(fēng)控的差別所在
最后再來看二者的差別,我們從客群的角度來對比。
對于具有征信記錄的優(yōu)質(zhì)客群,這部分客戶的信貸記錄多來自于銀行體系,意味著銀行不僅掌握其更細維度的借款歷史數(shù)據(jù),還掌握了其存款、理財?shù)蓉敻粩?shù)據(jù),在這部分用戶的大數(shù)據(jù)信用評判上,銀行是占據(jù)先機的,有其獨到的優(yōu)勢。
對于征信記錄較少或沒有征信記錄的客群,沒有了日光照射,對銀行而言,可能意味著徹底的黑暗,難以判斷用戶的信用情況;而掌握了用戶消費數(shù)據(jù)、社交數(shù)據(jù)的互聯(lián)網(wǎng)巨頭,掌握了月亮星辰之光,反倒可以大致看清用戶的輪廓,具備了差異化的優(yōu)勢。
問題來了,銀行為何不去掌握這些月亮星辰之光呢,因為有價值的行為數(shù)據(jù)多數(shù)都掌握在互聯(lián)網(wǎng)巨頭手中,這些巨頭像數(shù)據(jù)黑洞一樣,數(shù)據(jù)進得去、出不來,誰也拿不走,而正是這些數(shù)據(jù),構(gòu)成了其在次級用戶信用評級上的核心優(yōu)勢。
反過來再問,怎么去對抗這些數(shù)據(jù)黑洞呢?唯一的出路就是增加太陽光的照射范圍,即推動可以全社會共享的征信體系的發(fā)展,屆時,月亮星辰之光的影響也就越來越小了。
最后簡單總結(jié)下結(jié)論吧。
如果從大數(shù)據(jù)信用風(fēng)控的角度看,銀行與互金的主要差別就是因數(shù)據(jù)源的不同導(dǎo)致的客群有效性的差異,整體上,銀行的大數(shù)據(jù)風(fēng)控模型針對有征信記錄的用戶更為準確;互金巨頭的大數(shù)據(jù)風(fēng)控針對缺乏征信記錄的用戶更為有效,當(dāng)然,因為征信記錄是開放的,所以對于有征信記錄的用戶而言,互金巨頭的模型也可覆蓋,只是與銀行相比缺乏優(yōu)勢罷了。
如果從大數(shù)據(jù)欺詐風(fēng)控的角度看,銀行與互金則各有千秋,因為欺詐風(fēng)險更多地與業(yè)務(wù)模式和流程有關(guān),業(yè)務(wù)模式的不同決定了銀行和互金面臨的欺詐風(fēng)險很多情況下是不同的,所以缺乏可比性,應(yīng)該是各有各的特長。
如果從大數(shù)據(jù)在智能營銷上的應(yīng)用看,互金巨頭掌握了用戶的消費、社交等行為數(shù)據(jù),可以更好地了解用戶的行為偏好,從而可以更好地將金融產(chǎn)品融入場景打包推薦給用戶。相比之下,銀行掌握的更多是用戶有錢沒錢,在智能營銷上其應(yīng)用范圍就窄得多,在銷售基金和理財產(chǎn)品上精準度比較高,但在場景化金融上就要遜色很多。
如果從大數(shù)據(jù)在內(nèi)部管理上的應(yīng)用看,銀行業(yè)已經(jīng)進行了長達十幾年的探索,在很多方面是要領(lǐng)先的,而絕大多數(shù)的互聯(lián)網(wǎng)金融企業(yè),在這方面還需要補課。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10