
艾小繽:利用大數(shù)據(jù)篩查企業(yè)異常
艾小繽:金電聯(lián)行在這個行業(yè)里做的時間非常長,前6年大家都沒聽過,今年以來大家逐漸關(guān)注我們,因為我們做了一個事情,自認為是一件最底層的事情,這件事情做好了之后是可以改變中國的,下面我介紹一下金電聯(lián)行做的一些事兒。
首先我們破解中小企業(yè)融資難。為什么能破解?大家分析很多,答案早就知道,一個叫信息不對稱,一個叫缺現(xiàn)金流。
第二,量化的監(jiān)管,我們說金融是一個動態(tài)的,原來的監(jiān)管手段可能更多的要靠我們的人海戰(zhàn)術(shù),靠我們?nèi)タ?,有了一些新技術(shù)手段以后,我們能不能把這個事情變成一個實時的動態(tài)的監(jiān)管,這是我們要做的事情。
第三,更多的是跟政府合作,把政府的數(shù)據(jù)利用起來,進行數(shù)據(jù)化的治理。當然,政府手里的數(shù)據(jù)對金融行業(yè)來說是一種校驗功能,政府手里有大量的企業(yè)和數(shù)據(jù),如果這些數(shù)據(jù)被利用起來,對個人和企業(yè)的信息校準,去偽存真起到非常重要的作用。還有,政府手里有了數(shù)據(jù)之后,無論作為銀行也好,還是作為信用也好,大家都希望在一個群體里挑出優(yōu)質(zhì)的個人和企業(yè),再為他們提供金融服務(wù)。
我下面就這三點展開一下。
先說我們做的哪些事兒。實踐是檢驗真理的唯一標準,我們做了很多理論的東西,比如我們剛才展示的一些場景。第一,我們的平臺上現(xiàn)在已經(jīng)擁有了47萬家中小企業(yè)的數(shù)據(jù),大家越來越重視數(shù)據(jù)環(huán)境的時候,我們其實在前期已經(jīng)積累了很多數(shù)據(jù),今天發(fā)揮的價值越來越大。第二,我們通過跟民生銀行(7.33, 0.58, 8.59%)、廣發(fā)、平安等銀行的合作,包括現(xiàn)在開發(fā)了國開行。
我們累計為中小企業(yè)放貸40億,到今天沒有一筆不良業(yè)務(wù)。這也可以驗證數(shù)據(jù)能夠變成信用,信用能夠變成資產(chǎn),資產(chǎn)能變現(xiàn),并且我們能夠把風險控制住,當然這也是我們歷史做的一些成就,未來我相信如果感興趣大家可以一塊把這些事情做的更大。
第三,我們目前授信額度100萬以上,這是什么概念?大家了解互聯(lián)網(wǎng)金融的,包括余額寶[微博],我們大多數(shù)都是小微或者小小微,到了100萬以上,我們知道中小企業(yè)平均壽命不到三年,在這三年的過程中,我們怎么能把有風險的企業(yè)挑出來,好的企業(yè)挑出來,這是一個難度更大的事兒,并且它的需求量更大,要求更高。這塊我相信就是一個非常高風險的人群,但是高風險意味著高收益,利率市場化對應(yīng)的是什么?我們?nèi)绻扬L險定價定好了,這是一個利率市場化的基礎(chǔ)。所以,高風險里我們能不能淘出金子,這是下一步大家更關(guān)注的。
在量化風險管理方面,專門為存量客戶做量化的風險管理,目前已經(jīng)累計監(jiān)管了100億以上的資產(chǎn)。我們相當于有一個采油技術(shù),我們能把油提煉出來,變成汽油,變成化工產(chǎn)品,變成有價值的商品,這時候擁有數(shù)據(jù)的政府也好,銀行也好,企業(yè)也好,他才愿意開放他的數(shù)據(jù)給我們,這是一個正反饋。所以,我們有了這個技術(shù),現(xiàn)在有很多政府愿意把他手里的數(shù)據(jù)開放,我們還在做試點不能公開,但有有一個地區(qū)把它57個部委的所有數(shù)據(jù)都給我們開放了,在這個基礎(chǔ)上我們通過大數(shù)據(jù)的方式建立了個人信用和企業(yè)信用的平臺。
我們現(xiàn)在也是國內(nèi)第一批擁有企業(yè)征信牌照的企業(yè)。從創(chuàng)新角度來說,我們做了這幾方面的創(chuàng)新。第一,我們叫做理念創(chuàng)新,我們認為跟石油一樣,互聯(lián)網(wǎng)時代大家總說很多數(shù)據(jù)被互聯(lián)網(wǎng)記錄下來,但是我們發(fā)現(xiàn)除了互聯(lián)網(wǎng),還有很多東西同樣以數(shù)據(jù)的形式被記錄下來,這些在哪兒?在我們供應(yīng)鏈系統(tǒng)里,在我們稅收系統(tǒng)里,在我們政府掌握的水電氣資源資產(chǎn)管理各個方面,包括物聯(lián)網(wǎng)、北斗、海關(guān)數(shù)據(jù),擁有數(shù)據(jù)的企業(yè)和機構(gòu)大量存在,我們看到所有這些信息里含金量最大的是哪塊?我們要做這塊。數(shù)據(jù)并不是越多越好,初期的時候大數(shù)據(jù)看全貌,但是后期我們要看有價值的信息。怎么辨別出,這是我們要做的事情。
第二點,我們叫大數(shù)據(jù)金融,我們是以客觀信用為基礎(chǔ),由數(shù)據(jù)驅(qū)動的投資行為,我們相信這一定是未來的一個趨勢。我們把原來的模式叫做小數(shù)據(jù),因為我們原來看財務(wù)報表是一個等式,資產(chǎn)=負債+所有者權(quán)益,現(xiàn)在很多專業(yè)化的人士掌握了這個規(guī)律以后,能夠把報表做的很漂亮,大數(shù)據(jù)是過程,加結(jié)果,加時間,三維動態(tài),這個造假難度就非常大。數(shù)據(jù)挖掘去偽存真,還原真實。在今天的中國,社會能不能也產(chǎn)生西方那種信用體系的約束力?西方造假成本特別高,造完假以后,甚至直接會觸犯法律,中國造假成本很低,約束非常小。我們能夠通過數(shù)據(jù)真實的還原一個個體,無論是個人還是企業(yè),從而產(chǎn)生對于這個個體的約束力,這就是我們做信用體系的一個基礎(chǔ)。
我們也獲得了一些認可,與政府各方面都有一些合作,今天不能展開特別多,感興趣的朋友我們可以再找機會詳細的溝通。
第一,我們自有數(shù)據(jù)+數(shù)據(jù)入口,就是數(shù)據(jù)挖掘機器人(39.040, -0.42, -1.06%)加開放入口,包括數(shù)據(jù)交換,有數(shù)據(jù)基礎(chǔ)是做大數(shù)據(jù)的必要條件,如果沒有這個條件,我們后面所有的東西都是不成立的。
第二,把數(shù)據(jù)變成資產(chǎn),這是一個提煉過程,首先采集、分類、完整度、清洗、分析計算,輸出數(shù)據(jù)資產(chǎn)包,這里面有可視化數(shù)據(jù)。我們現(xiàn)在跟金融機構(gòu),跟政府合作,第一是要解決信息對稱問題,就是在初期沒有任何的信用評價標準,但是信息對稱是一個最基礎(chǔ)的要求,需要把數(shù)據(jù)結(jié)構(gòu)化,去偽存真,把數(shù)據(jù)通過可視化的東西呈現(xiàn)出來,這是我們要做的根本。第二是系統(tǒng)評分,大家進一步合作,通過指標化的體系把一個個體或者企業(yè)區(qū)分歸類,分級管理。第三是額度測算,這是一個非常重要的前提,我們現(xiàn)在所謂的抵質(zhì)押和擔保,都看二次償債能力,但是一個企業(yè)怎么做融資,將來怎么界定這個企業(yè)的價值,一定要還原它一次償債能力,就是它創(chuàng)造財富的能力。所以,這一點我相信額度測算這一塊,所有股東對企業(yè)的投資,包括剛才說的眾籌,它怎么管風險,怎么定義,怎么定價這個企業(yè),這都是一個基礎(chǔ)。二次挖掘,剛才說有一個非常干凈的數(shù)據(jù)基礎(chǔ)之后,大家可以充分的把數(shù)據(jù)利用起來。
我們的特色是什么?自動化加人工,計算機本身沒有智能,它都是向人學習的。我們開始建模的時候達不到這個程度,頂多是一半一半,最早的時候更多的是人,慢慢的調(diào)試調(diào)試,讓它產(chǎn)生一些自學習的能力,今天我們達到了99%智能+1%的人工。
目前看所有的點都是可以形成產(chǎn)品的,第一個叫征信,數(shù)據(jù)采集,這塊是我們解決中小企業(yè)融資難的起點,如果解決不了這個問題,我們后面的都不成立。二叫異常篩查,去偽存真,我們沒有能力辨別真假,但是我們可以辨別異常,任何事情都是這樣。我們怎么辨別呢?從個人來講,昨天我跑100米用了18秒,今天你給我投資,我馬上跑進10秒,這件事情是不成立的,因為違反了規(guī)律。我們提煉出數(shù)據(jù),用規(guī)律來衡量它,看這個數(shù)據(jù)是不是異常,這是第一點。
第二點叫同類比較,我們把同樣數(shù)據(jù)特征的企業(yè)放在一塊,這個有點兒像體檢報告。我們看所有的體檢報告,血常規(guī),白血球,紅血球的范圍,這個范圍怎么來的?一定是在千萬人,甚至上億人檢測的基礎(chǔ)上,在這個范圍內(nèi)構(gòu)造正常人,你超出了就變成兩種,要么是超人,要么就是病人,超人沒見著,基本都是病人。我們把同類企業(yè)歸成一個模型,把個體扔進去,看你的數(shù)據(jù)跟同類企業(yè)比較有多大差異,如果有異常,我們不是大夫,但是可以做體檢報告告訴大夫這個有異常,誰來判斷?銀行或者政府,他們來看這個數(shù)據(jù),有針對性的看就能夠辨別出這個企業(yè)或者這個個體是不是有問題。異常篩查是非常重要的環(huán)節(jié)。
第三,數(shù)據(jù)造影。大家看人分黃種人、白種人、黑種人,我們現(xiàn)在看人看企業(yè)也是一樣的,我們通過外在的東西去描述它,去關(guān)注它,但是我們現(xiàn)在從DNA,從細胞的角度,我們有了這些數(shù)據(jù)之后,我們就能夠把個體,把個人也好,把企業(yè)也好,數(shù)據(jù)造影,從數(shù)學的角度它的一個什么個體,這是最真實的。
第四是評分,我們決策怎么用,那么多的數(shù)據(jù),我們說現(xiàn)在面臨兩個極端,第一要不數(shù)據(jù)不對稱,我們看不到企業(yè)數(shù)據(jù),要不來一大堆,海量的數(shù)據(jù)來了我們怎么用。所以,大家認可的標準來評判企業(yè),就是我們對它的信用評級。這個標準怎么形成?一定是我們通過實踐一塊來。所以,我們希望這是一個起步的階段,通過這種評分,最終形成標準有什么好除呢?第一大大的提升效力。為什么?我們說拿它內(nèi)部的真實數(shù)據(jù)和敏感數(shù)據(jù)給出來的時候,他是不愿意。我們又要他提供這個東西,怎么解決?如果我們有一個公共認可的征信標準,一個評分標準,企業(yè)通過他真實的東西,我們給他一個真實的評分,大家依據(jù)這個去做企業(yè)篩查和判斷的時候,效力就非常高,企業(yè)也更愿意做這件事情,當然這是一個很宏大的事情,但是企業(yè)在今天如果我們開始做了,我們就能提升效力降低成本。
最后一個是動態(tài)跟蹤。對個人也好,也好,拿到錢之前和拿到錢之后他的準備很可能發(fā)生大的變化,這種變化也許會把一個好人變成一個老賴,也許會把一個企業(yè)給弄崩潰,這個風險怎么辦?就要實時的跟蹤,要掌握它的變化。所以,我們每一塊都會產(chǎn)生相應(yīng)的價值。
最后數(shù)據(jù)采集不展開了,三個入口,第一個叫數(shù)據(jù)主動填報,我們通過個人和企業(yè),因為我們有篩查、數(shù)據(jù)清洗的能力,在這個基礎(chǔ)上,造假的話會進入黑名單,他在不了解我們算法的情況下,我們目前看,第一數(shù)據(jù)填不上來,第二填的不真實。所以,主動填報已經(jīng)解決了很多技術(shù)上解決不了的問題。第二,數(shù)據(jù)挖掘機器人,這是我們傳統(tǒng)的業(yè)務(wù),通過供應(yīng)鏈,通過數(shù)據(jù)記錄,包括你可能在各種電商平臺做的所有數(shù)據(jù)我們都能挖掘出來。第三政府公開的數(shù)據(jù)。
數(shù)據(jù)縱向、橫向,我們現(xiàn)在當然有局限性,大數(shù)據(jù)不要把它神化。第一,目前覆蓋三類,叫能耗型、商品型、人力型。第二我們叫風險多角度關(guān)系,一個個體的風險,角度越多,對它描述越完整。所以,我們說我們只是換了一個角度,增加一個角度看一個個體,我們一定是補充。第三個,我們不是全能的,我們對一個個體,一個企業(yè),至少有一年以上的數(shù)據(jù),要不我們真是算命的了。還有就是我們不計算主觀還款意愿,我們只計算客觀的還款能力。這個人有錢不還,這事兒我們現(xiàn)在掌握不了。但是我們知道他是有能力來還的。不分析小概率事件,只計算大概率事件。突發(fā)性的風險沒法做,這是大數(shù)據(jù)的限制。所以,大家一定要利用它,也不要迷信它,要跟自己實際的東西結(jié)合起來,你說現(xiàn)在全互聯(lián)網(wǎng)化也不太現(xiàn)實,我們更多的希望是O2O的方式,線上線下結(jié)合,一步步過渡到未來的理想模式。底下是研發(fā),最終我們需要跟銀行,跟政府,跟第三方的金融平臺合作推出各種產(chǎn)品。
我們給投資人提供信息,信用信息查詢,等級報告,深度信用體檢報告,這塊是作為我們的基礎(chǔ),也是作為我們的定位,能夠跟所有,其實我們有了這個定位之后,其實跟大家都是合作伙伴,沒有任何競爭,我們就是一個第三方征信,大家只要建立信用關(guān)系之后,就能通過各方面合作起來,開發(fā)新的金融產(chǎn)品。
現(xiàn)在說成本高,成本高到什么程度都是按年化的,真正企業(yè)需要錢的時候,一年大概十幾天,剩下的時間資金成本都是浪費的,如果在這個基礎(chǔ)上我們?nèi)绻軐崟r的看到他動態(tài)的資金需求,我們甚至能夠像余額寶一樣隨借隨貸,有錢了馬上還,如果能實現(xiàn)這種,你想我們所謂的資金成本問題還是問題嗎?我們的年化,比如給他30%但他只貸了10天,對他資金成本能有多大的壓力?如果建立在一個數(shù)據(jù)化的基礎(chǔ)上,我們能想象的空間,我們能做的金融產(chǎn)品是無限多的。所以,我們相信未來在數(shù)據(jù)基礎(chǔ)上,一定是一個數(shù)據(jù)資產(chǎn)化的過程。
我們現(xiàn)在基本上是按地區(qū)+產(chǎn)業(yè)這種方式跟大家進行合作。我今天就講到這兒,也希望能給大家有一點點啟示,也希望能在信用體系建設(shè)方面,數(shù)據(jù)挖掘方面,應(yīng)用方面,在金融創(chuàng)新方面跟大家一塊共同開發(fā),共同成長。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10