大數(shù)據(jù)根本無法解答風(fēng)控命題別扯了
現(xiàn)在很多人在扯大數(shù)據(jù)能解決風(fēng)控難題,事實(shí)上都是一廂情愿,不現(xiàn)實(shí)也不可能!
誠然,大數(shù)據(jù)可以優(yōu)化管理、提高風(fēng)控效率、降低風(fēng)控成本,但是無法決定風(fēng)控質(zhì)量,金融機(jī)構(gòu)的風(fēng)控質(zhì)量永遠(yuǎn)是個(gè)一攬子系統(tǒng)工程。不同金融機(jī)構(gòu)面對(duì)同一風(fēng)險(xiǎn)等級(jí)的客戶,它們的風(fēng)控往往不是同一個(gè)水平。因?yàn)椴煌慕鹑跈C(jī)構(gòu)有不同的風(fēng)險(xiǎn)承受能力,自然會(huì)形成不同的風(fēng)險(xiǎn)定價(jià),存在差異性。
所以,我曾說,很多互聯(lián)網(wǎng)金融公司提出來的征信系統(tǒng)接口如何開放的問題,其實(shí)是無法解答風(fēng)控命題的。不是說征信系統(tǒng)開放了,你風(fēng)控就OK了,這是不可能的。因?yàn)槿袠I(yè)都面對(duì)同一個(gè)征信系統(tǒng),最終的使用效率、定價(jià)能力,還是取決于你自己的能力。越是公開透明的市場(chǎng),其實(shí)競(jìng)爭(zhēng)的難度越大,單純開放征信系統(tǒng)不能解決風(fēng)控問題。
仔細(xì)分析下為什么大數(shù)據(jù)無效,我的理由是多方面的——
大數(shù)據(jù)無法預(yù)測(cè)系統(tǒng)性風(fēng)險(xiǎn)
第一個(gè)理由就是,金融其實(shí)是看天吃飯的。我一直堅(jiān)持認(rèn)為——金融是被經(jīng)濟(jì)形勢(shì)所決定的,在經(jīng)濟(jì)形勢(shì)低迷的情況下,金融機(jī)構(gòu)無論怎么折騰都很難玩出特別好的花樣。2008年金融危機(jī)一來,覆巢之下安有完卵,就是這么簡(jiǎn)單的道理。系統(tǒng)性風(fēng)險(xiǎn)是任何一家金融機(jī)構(gòu)都必須面臨的現(xiàn)實(shí)問題,大數(shù)據(jù)風(fēng)控在系統(tǒng)性風(fēng)險(xiǎn)面前,毫無意義。
那么,大數(shù)據(jù)能否預(yù)測(cè)經(jīng)濟(jì)形勢(shì),即預(yù)測(cè)系統(tǒng)性風(fēng)險(xiǎn)呢?很多人說大數(shù)據(jù)可以做到,我覺得都是扯淡。過去是無法有效推演未來的!
就個(gè)人而言,是否有通過數(shù)據(jù)分析形成準(zhǔn)確判斷的可能性?這個(gè)很難說,有人一葉而知秋,有人一葉而障目,都是個(gè)人能力的結(jié)果。個(gè)人能力很難說是一種模式的核心競(jìng)爭(zhēng)力,也缺乏可持續(xù)性。
經(jīng)營(yíng)性貸款無法進(jìn)行大數(shù)據(jù)風(fēng)控
第二個(gè)理由是,金融行業(yè)其實(shí)不完全符合大數(shù)據(jù)所要求的邏輯前提。大數(shù)據(jù)的核心邏輯前提是統(tǒng)計(jì)學(xué),有兩個(gè)要素:一是樣本篩選,就是通過
數(shù)據(jù)篩選出相同
特征的群體出現(xiàn)違約的概率;二是需要足夠數(shù)量來覆蓋統(tǒng)計(jì)學(xué)里的偶發(fā)性
特征。兩者是統(tǒng)一而不可分割的。
因?yàn)榇髷?shù)據(jù)的相關(guān)性必然是建立在足夠大樣本量基礎(chǔ)上的,僅僅是個(gè)體相關(guān)不足以成為推斷相關(guān)性的基礎(chǔ)。也就是說,在金融業(yè)務(wù)操作的時(shí)候,也必須覆蓋足夠大的人群,但足夠大是多少?對(duì)于單一金融機(jī)構(gòu)而言,“足夠大”已經(jīng)是個(gè)絕對(duì)致命的難題了。
另外,這里其實(shí)還隱含一個(gè)基礎(chǔ)邏輯,就是每個(gè)操作的業(yè)務(wù)群體還要呈現(xiàn)獨(dú)立非相關(guān),否則也沒啥意義。
這里我們做個(gè)小討論:經(jīng)營(yíng)性貸款能否做大數(shù)據(jù)風(fēng)控?我認(rèn)為,經(jīng)營(yíng)性需求很難使用數(shù)據(jù)來進(jìn)行模型化。為什么呢?先從企業(yè)主來看。什么人會(huì)成為企業(yè)主?事實(shí)上,只要成為企業(yè)主,無論是大是小,他們都自動(dòng)從普通人群里獨(dú)立出來了。再小的企業(yè)主,其實(shí)都是社會(huì)的另類,成功的是精英,失敗的是腦殘,唯一不可能的就是社會(huì)公眾。所以這類人本身就是異類,個(gè)個(gè)都充滿極大的不確定性和變數(shù),很難被量化和模型化。
這里還有一個(gè)問題,相同的人群在不同場(chǎng)合呈現(xiàn)的
特征是不一樣的,尤其是目前人們?cè)诰€上、線下割裂的狀態(tài),其行為方式往往會(huì)出現(xiàn)強(qiáng)烈的反差。因此,對(duì)于同一個(gè)人,根據(jù)單一維度數(shù)據(jù)對(duì)其進(jìn)行判斷的意義是很有限的,不同維度的數(shù)據(jù)會(huì)反映出極為不同的
特征,這時(shí)候全數(shù)據(jù)就顯得異常重要。
所謂全數(shù)據(jù),就是N=所有,這個(gè)概念是牛津大學(xué)互聯(lián)網(wǎng)中心的維克托邁爾-舍恩伯格教授提出的,他最喜歡的對(duì)于大數(shù)據(jù)集合的定義是“N=所有”,這里不再需要采樣,因?yàn)槲覀冇姓麄€(gè)人群的數(shù)據(jù)。這就好比選舉監(jiān)察人不會(huì)找?guī)讖堄写硇缘倪x票來估計(jì)選舉的結(jié)果,他們會(huì)記點(diǎn)每一張選票。當(dāng)“N=所有”的時(shí)候,確實(shí)不再有采樣
偏差的問題,因?yàn)椴蓸右呀?jīng)包含了所有人。
這個(gè)說法很有意思,因?yàn)榛ヂ?lián)網(wǎng)的海量容納數(shù)據(jù)的可能性,的確給了全數(shù)據(jù)一個(gè)很好的假設(shè)前提,但是這個(gè)命題很容易回歸到假設(shè)的前提上去,在未實(shí)現(xiàn)全數(shù)據(jù)之前,就別談大數(shù)據(jù)了,毫無意義!
金融行業(yè)會(huì)“未來改變現(xiàn)在”
第三個(gè)理由是,大數(shù)據(jù)的前提——“過去決定未來”,并不總是成立的?,F(xiàn)實(shí)中往往會(huì)出現(xiàn)未來改變過去的情況。這個(gè)有點(diǎn)難以理解,啥意思呢?其實(shí)很簡(jiǎn)單,就是一個(gè)人某些
特征值的改變,會(huì)改變系統(tǒng)對(duì)他過去的數(shù)據(jù)所形成的基本
特征的認(rèn)定。
比如我們經(jīng)常說“男人有錢就變壞”,這里隱含的邏輯是,過去判斷一個(gè)男人是好人,是建立在他沒錢的基礎(chǔ)上的。而一旦這個(gè)基礎(chǔ)被破壞,這個(gè)男人變成有錢人的時(shí)候,他就已經(jīng)脫離了最早的系統(tǒng)判定,進(jìn)入另外一個(gè)范疇了。因此,這個(gè)未來的變化,直接把過去建立的邏輯給打破了。
這種現(xiàn)象其實(shí)是一個(gè)循環(huán)函數(shù)的概念,帶有變量值的東西往往是無法建模型的。我們?cè)诮鹑谶\(yùn)作中經(jīng)常發(fā)現(xiàn)這樣的現(xiàn)象:給錢之后的企業(yè)跟給錢之前的企業(yè),是有絕對(duì)不同的基礎(chǔ)性
特征的。過去往往被未來給改變了。
以前也碰到過有人談所謂的“量化炒股”,設(shè)定各種各樣的模型來實(shí)現(xiàn)炒股的自動(dòng)化。這種方法,在你規(guī)模不大的情況下,我認(rèn)為還真是有一定的成功概率的。但是一旦你的規(guī)模足夠大,你自己也成為了市場(chǎng)的重要角色的時(shí)候,你就會(huì)發(fā)現(xiàn)你所有模型失效了,因?yàn)槟氵M(jìn)入了死循環(huán)?!躲y河帝國(guó)》里面給了一條重要的假設(shè),就是所有成為統(tǒng)計(jì)樣本的樣本主體,并不知道自己是被統(tǒng)計(jì)的樣本,否則就會(huì)失去統(tǒng)計(jì)意義。
前段時(shí)間碰到一朋友,談到大數(shù)據(jù)風(fēng)控,我們無法在大數(shù)據(jù)是否可以建立風(fēng)控模型上達(dá)成一致。最后,退而求其次,我就說,好吧,假設(shè)你的模型能成立,事實(shí)上,你會(huì)面臨一個(gè)非常嚴(yán)重和致命的問題,就是你的客戶群體,會(huì)變得讓你越來越不認(rèn)識(shí)。
為什么呢?因?yàn)橐坏┠郴ヂ?lián)網(wǎng)金融公司采取大數(shù)據(jù)的量化放貸,在市場(chǎng)就會(huì)出現(xiàn)大量的放貸機(jī)構(gòu),依附在這個(gè)互聯(lián)網(wǎng)金融公司之上,進(jìn)行尾隨和跟蹤放貸。也就是在這個(gè)金融公司放貸的基礎(chǔ)之上,再配置20%左右的貸款,期限比其更短。在這種情況下,這個(gè)金融公司之前所設(shè)定的所謂模型,會(huì)全部失去效應(yīng)。事實(shí)上,在傳統(tǒng)信貸中,浙江大量股份制銀行就是采用如此策略,使得大銀行的所謂風(fēng)控審核都形同虛設(shè)。
“風(fēng)險(xiǎn)滯后”使風(fēng)控?zé)o法數(shù)據(jù)模型化
第四個(gè)理由是,金融業(yè)還有一個(gè)與其他行業(yè)不同的地方,就是風(fēng)險(xiǎn)滯后。風(fēng)險(xiǎn)滯后意味著什么呢?意味著由過去數(shù)據(jù)所推導(dǎo)的模型,會(huì)在過去和未來之間留有一段縫隙,這個(gè)縫隙中所發(fā)生的任何變化,都讓你無法有效調(diào)整風(fēng)險(xiǎn)的認(rèn)定。簡(jiǎn)單舉例,我們根據(jù)餐飲企業(yè)的大量數(shù)據(jù)推導(dǎo)出某一風(fēng)控模型之后,進(jìn)行批量化的業(yè)務(wù)操作,等著貸款回收。
這期間,銀行基本無主動(dòng)權(quán),你要回收貸款,人家第一要有錢,第二要配合。實(shí)際上,貸前你是老大,貸后你就是孫子了。而突然某一天政府發(fā)文要求降低三公消費(fèi),你就等著傻眼吧!所有的數(shù)據(jù)都會(huì)因?yàn)槠陂g任何一個(gè)偶發(fā)性變化而發(fā)生實(shí)質(zhì)性變化,而你卻喪失了主動(dòng)權(quán)。
所以,我們哪怕撇開目前大數(shù)據(jù)受限制于數(shù)據(jù)孤島等一系列的現(xiàn)實(shí)問題(全維度數(shù)據(jù)的成本極高、難度極大,美國(guó)政府的棱鏡計(jì)劃有點(diǎn)這個(gè)意思,但那幾乎是集中了一個(gè)國(guó)家的資源),就單一大數(shù)據(jù)風(fēng)控而言,實(shí)現(xiàn)風(fēng)控的數(shù)據(jù)模型化只是美好的設(shè)想,是脫離了社會(huì)現(xiàn)實(shí)的一種自我意淫的產(chǎn)物。除非體系內(nèi)不存在市場(chǎng)博弈行為,毫無競(jìng)爭(zhēng)對(duì)手。不過,真到了市場(chǎng)毫無競(jìng)爭(zhēng)對(duì)手的情況,你需要風(fēng)控模型么?閉著眼睛做就行了。
大數(shù)據(jù)的現(xiàn)實(shí)意義
當(dāng)然,我這里并非是全盤否認(rèn)大數(shù)據(jù)的現(xiàn)實(shí)意義。大數(shù)據(jù)可以有效地提升效率,降低管理成本,作為金融機(jī)構(gòu),效率的提升和管理成本的下降,最終都是提升了對(duì)抗風(fēng)險(xiǎn)的能力。因此,大數(shù)據(jù)雖然不能直接提高風(fēng)控能力,但也具備重要的現(xiàn)實(shí)意義。
我在看金融史和馬克思的《資本論》時(shí),會(huì)設(shè)想一個(gè)奇怪的命題:大數(shù)據(jù)能否讓計(jì)劃經(jīng)濟(jì)回歸?這個(gè)說法其實(shí)最早是胡曉明先生提出來的,我后來越想越有道理。
馬克思等人提出,社會(huì)總是生產(chǎn)出那些高于實(shí)際需要的產(chǎn)品,牛奶寧愿倒掉也不給予普通民眾,說明市場(chǎng)的生產(chǎn)是過度的。為什么如此?雖然從結(jié)果來看,市場(chǎng)經(jīng)濟(jì)是高效的資源配置方式,但從過程來看,市場(chǎng)經(jīng)濟(jì)的弊端也是非常明顯的,它高效的背后其實(shí)是巨大的資源浪費(fèi)。一個(gè)成功企業(yè)的背后是倒下的無數(shù)個(gè)類似企業(yè),這些都是要計(jì)入的社會(huì)成本。因此,市場(chǎng)經(jīng)濟(jì)高效率的背后其實(shí)是整個(gè)社會(huì)的低效率。
在這種情況下,計(jì)劃經(jīng)濟(jì)從其出發(fā)點(diǎn)來看,力圖構(gòu)建一個(gè)體系,讓市場(chǎng)需求能被有效計(jì)算,然后以需定產(chǎn),從而最大程度地降低社會(huì)成本。理論無限美好,但現(xiàn)實(shí)中卻往往發(fā)現(xiàn),需求是無法統(tǒng)計(jì)和計(jì)算的。缺乏有效的統(tǒng)計(jì)手段,從而使得理想也只是理想。計(jì)劃經(jīng)濟(jì)的失敗,讓前蘇聯(lián)的生產(chǎn)和實(shí)際需求產(chǎn)生了極大的錯(cuò)位,重工業(yè)泛濫而輕工業(yè)不足。
那么,現(xiàn)在
大數(shù)據(jù)匹配
云計(jì)算,是否可以解決這個(gè)問題呢?理論上是否可能讓計(jì)劃經(jīng)濟(jì)回歸或者部分回歸?呵呵,很有意思的問題。
不扯遠(yuǎn)的了??赡芎芏鄬<視?huì)認(rèn)為我的理解過于膚淺,但是,從金融運(yùn)行實(shí)踐來看,我對(duì)自己的結(jié)論還是抱有極大信心的。其實(shí),大數(shù)據(jù)即使成功,也必然只是個(gè)別案例,不具備普遍性。因?yàn)閷?duì)于同一數(shù)據(jù),不同的機(jī)構(gòu)對(duì)其有效應(yīng)用的能力必然是不同的,而這種應(yīng)用能力,才是機(jī)構(gòu)之間競(jìng)爭(zhēng)的關(guān)鍵。
CDA數(shù)據(jù)分析師考試相關(guān)入口一覽(建議收藏):
? 想報(bào)名CDA認(rèn)證考試,點(diǎn)擊>>>
“CDA報(bào)名”
了解CDA考試詳情;
? 想學(xué)習(xí)CDA考試教材,點(diǎn)擊>>> “CDA教材” 了解CDA考試詳情;
? 想加入CDA考試題庫,點(diǎn)擊>>> “CDA題庫” 了解CDA考試詳情;
? 想了解CDA考試含金量,點(diǎn)擊>>> “CDA含金量” 了解CDA考試詳情;