
信貸大數(shù)據(jù):禍兮?福兮?_數(shù)據(jù)分析師
2008年末,從國外度完蜜月,回到位于美國佐治亞州亞特蘭大市的家中,凱文?約翰遜(Kevin Johnson)發(fā)現(xiàn)了兩件事:金融體系正在崩潰,信箱里有一封來自信用卡公司的信。
美國運通(American Express)在信中告知他的信用額度從10800美元下調到了3800美元,理由是,約翰遜光顧的那些商店的???,都是該公司認為還款記錄不佳的人。
約翰遜是一個媒體和互聯(lián)網(wǎng)企業(yè)家,并以此為傲。在約翰遜看來,只是基于和他在相同的商店里購物的顧客的行為,就認為他財力有限,這根本站不住腳。約翰遜表示,當時他的FICO評分在760左右,絕對屬于信用良好的范疇。FICO評分是美國衡量消費者信用度的標準指標。
“那有點像一記警鐘,”約翰遜說,“金融危機為公司創(chuàng)造了絕好的機會,采用一些狡猾的算法將本應獲得貸款的人們拒之門外?!?/span>
約翰遜(他還是個非裔美國人)將信件公諸于眾,推動了一場關于這種信用評測是否公允的辯論。最終運通放棄了這種做法,并且2009年美國總統(tǒng)巴拉克?奧巴馬(Barack Obama)簽署通過的信用卡法案(Credit Card Act)也加入了一條要求進一步研究這種做法的條款。
6年后,金融公司有了新選擇——海量數(shù)據(jù)分析技術,讓觀察購物習慣的方法相形之下顯得非常原始。從社交媒體、數(shù)字數(shù)據(jù)中間商和網(wǎng)絡記錄等渠道收集而來的海量信息,經(jīng)過算法分析,可用于評定個人信用度,或用于向他們定向投放產(chǎn)品廣告。
目前還不清楚主流銀行和信用卡公司在多大程度上使用這些算法,也不清楚這些算法的數(shù)據(jù)輸入、計算和計算結果情況如何。一方面,許多種數(shù)據(jù)驅動算法因不透明和霸道而受到批評;另一方面,將數(shù)字化信用評分運用到金融領域又引出了這種做法是否公允的問題。批評者稱,使用這些信息對借款人進行預測可能會變成一種自我實現(xiàn)的預言,拒絕向那些與無法獲得信貸有關聯(lián)的人提供信貸,會固化富人與窮人之間的分界線。
“只要走錯一步,你就可能陷入死亡漩渦,算法會擴大一個不良數(shù)據(jù)點,引起連帶效應,”馬里蘭大學(University of Maryland)法學教授弗蘭克?帕斯奎爾(Frank Pasquale)說。他著有一本關于算法的書——《黑箱社會》(The Black Box Society)。
這種技術的支持者認為,能夠根據(jù)潛在客戶有哪些朋友、雇主是誰、乃至鍛煉習慣如何,得出對這些客戶的全面評價,最終將有助于讓那些難以在銀行開戶或獲得公平貸款的人有能力獲得信貸。
“當消費者進入一種導致他們的財務狀況稍微有些失控的支出模式時,他們還能否回到正軌、以及將如何回到正軌?這就是我們能從大數(shù)據(jù)世界獲得的數(shù)據(jù),”Moven的總裁亞歷克斯?塞恩(Alex Sion)說。Moven旨在為希望更好地掌握自己的消費習慣的用戶提供借記賬戶。
支持者和反對者都同意,在貧富差距成為熱點政治問題的背景下,新一代以數(shù)據(jù)為中心的信貸核發(fā)方式和算法評分會引發(fā)法律問題。
“現(xiàn)在這還是一大塊灰色地帶,”曾幫助交友網(wǎng)站eHarmony開發(fā)匹配引擎的科學家蓋倫?巴克沃爾特(Galen Buckwalter)說。現(xiàn)在他為非傳統(tǒng)貸款機構Payoff工作?!把呀?jīng)從瓶子里跑了出來,我們已無法回頭,不管是收回信息,還是告訴企業(yè)它們不能再分析點擊次數(shù)、甚至鍵入模式之類的東西,都是不可能的了?!?/span>
美國國家檔案館(National Archives)里放著一份1935年的大亞特蘭大(Greater Atlanta)地區(qū)地圖,上面有藍色、黃色和紅色三種顏色的區(qū)域。旁邊的手寫圖例寫著:“淺藍——最佳,深藍——尚可,黃色——顯然在惡化,紅色——危險”。
這是美國歷史上那段黑暗時期的顯著標志。當時,對潛在借款者進行分類的依據(jù),不是他們的個人信用特征,而是他們所居住的區(qū)域。
“標紅”區(qū)域通常比較貧困,居民以某個種族或民族的人為主。在亞特蘭大和施行種族隔離的美國南部其他城市,這種做法通常是為了阻止非裔美國人移居到白人為主的社區(qū)。
公平借貸法和平等信用機會法等一系列法規(guī)出臺后,標紅區(qū)域的做法被法律禁止。但令人憂慮的是,在21世紀,標紅區(qū)域或許不是用紙和墨水公開寫出來的,而是依靠計算機和互聯(lián)網(wǎng)傳輸?shù)臄?shù)據(jù)完成的。
盡管美國法律禁止根據(jù)性別或種族等因素歧視借款者,但事實表明,通過解析Facebook和Twitter等社交網(wǎng)絡上的公開信息,可以精確預測用戶的一切信息,從政治傾向、到族裔、再到性取向。
批評者最主要的憂慮是,使用新型的數(shù)據(jù)和計算機算法,企業(yè)和機構能夠建立“代理”,不公開通過性別或者種族等因素進行歧視,但可能利用相互關聯(lián)的信息建立某個特定客戶的深度剖析檔案。
“現(xiàn)在有了數(shù)據(jù),你可以預測任何事情,”零售金融服務初創(chuàng)公司One Financial的創(chuàng)始人馬克斯?加內(Max Gasner)說,“根據(jù)Facebook和Twitter上的數(shù)據(jù),可以判斷你是什么種族,是同性戀還是異性戀。你可以預判出很多法律禁止作為借貸審核依據(jù)的信息,歧視也可以做得更加隱蔽?!?/span>
認真查看“點擊流”數(shù)據(jù),或者使用讓公司能夠追蹤用戶互聯(lián)網(wǎng)活動的“網(wǎng)路信標”,能夠僅通過觀察個人如何接入和瀏覽網(wǎng)絡,就發(fā)現(xiàn)關于個人的身份或者社會經(jīng)濟地位的寶貴線索。例如,皮尤研究中心(Pew Research Center)和美聯(lián)儲(Fed)的研究發(fā)現(xiàn),黑人和拉丁裔使用手機訪問銀行賬戶的傾向要高得多,因此只要查看人們?yōu)g覽網(wǎng)絡的方式就能發(fā)現(xiàn)其種族身份。
“因為大數(shù)據(jù)評分使用的算法不公開,所以不可能分析算法帶來的潛在的種族歧視影響,”美國國家消費者法律中心(NCLC)在最近一份關于大數(shù)據(jù)的研究報告中寫道。
除了算法本身,監(jiān)管借貸領域的大數(shù)據(jù)應用的法律依然很模糊。
“說到大數(shù)據(jù),還沒有明確的禁令規(guī)定不可以在核發(fā)貸款時使用大數(shù)據(jù),”美國世達律師事務所(Skadden Arps)的合伙人阿南德?拉曼(Anand Raman)說,“然而,如果使用這種數(shù)據(jù)得出的結果對某個受保護群體的成員超乎尋常地不利,那么這種做法就可能變成一個公平借貸問題?!?/span>
正是出于對監(jiān)管審查的擔憂,許多大銀行和信用卡機構盡管據(jù)信正在進行新數(shù)據(jù)方面的嘗試,但卻不愿意全心全意投入到非傳統(tǒng)信貸信息的世界中。
“對社交數(shù)據(jù),所有的信用卡公司實在是又愛又怕,”某大型信用卡公司的前數(shù)據(jù)挖掘師說。他表示,公開使用大數(shù)據(jù)來指導貸款核發(fā)的金融集團或許面臨“登上報紙頭條的風險,或者可能會被認為存在歧視”,就像信用卡公司2008年發(fā)給約翰遜的那封信造成的后果那樣。
事實上,到目前為止,公開使用非傳統(tǒng)信息的大多是一些初創(chuàng)公司。這些公司表示,它們的目標是利用如今可用的各種數(shù)據(jù)的大雜燴,從而更高效地發(fā)放貸款,或是向那些缺乏傳統(tǒng)信貸信息的人發(fā)放貸款。
使用互聯(lián)網(wǎng)、將借款人和貸款人直接聯(lián)系起來的個人對個人(P2P)貸款機構,就是一個突出的例子;許多P2P貸款機構使用社交媒體信息和其它類型的非傳統(tǒng)數(shù)據(jù)來補充貸款核發(fā)流程,或防止欺詐——比如,自動驗證申請貸款者的職業(yè)信息是否符合他們的領英(LinkedIn)資料。
分析社交網(wǎng)絡或許能讓貸款機構不僅猜測出申請貸款者的種族、社會經(jīng)濟地位,還能猜測出他們的顧客忠誠度相對如何。同樣的,研究申請者點擊和瀏覽網(wǎng)頁的方式,能提供有關其性格特征的線索,比如是否沖動。可穿戴技術能夠追蹤從鍛煉習慣到心率的一切信息,這種技術的應用也為渴求數(shù)據(jù)的貸款機構打開了另一片信息領域。
“如果你是一個有條理、有責任心、習慣良好的人,那么你的信用基本上也會很好,”Payoff負責行為科學的副總裁Andy Wen說,“這些事情往往是相互聯(lián)系的,如果你看到一個人在某個生活領域的行為很有條理,你會認為這種行為也會反映到信用上。”
這些公司堅信,利用行為數(shù)據(jù)可以讓原本無法獲得信用的人獲得信貸。此外,很多人表示,利用這種信息可以去除貸款核發(fā)流程中的主觀性,以往的貸款核發(fā)流程涉及由實體銀行網(wǎng)點的信貸員親自對貸款申請者進行評估。
“如果你探查大數(shù)據(jù)是什么,它本質上就是對客觀信息的使用?!崩f,“我們絕對可以說,從降低公平借貸風險的角度出發(fā),使用客觀信息好過依賴主觀判斷或自行決定?!?/span>
有人說,比起核發(fā)金融產(chǎn)品,大數(shù)據(jù)和算法驅動的消費者評分可能在金融產(chǎn)品營銷方面用處最大。尼爾森(Nielsen)的Prizm市場分級法(Potential Rating Index by Zip Market,依靠郵編的潛在市場評級指數(shù))依靠郵編將消費者劃分為從“上層階級”到“社會底層”的多種范疇。該分級法將“社會底層”群體描述為由“多種族裔”的單身男女和單親父母組成的“過渡”階層。這種精準定位意味著非目標群體的成員可能僅因為他們永遠不會看到相關廣告,而永遠沒機會獲得某種貸款或金融產(chǎn)品。
美國國家消費者法律中心的報告發(fā)現(xiàn),基于非傳統(tǒng)數(shù)據(jù)評估流程出售的信貸產(chǎn)品,年利率可達到134%到748%——這種三位數(shù)的利率更像是發(fā)薪日貸款的典型利率,而不是信用卡會有的利率。
“這些技術總是被宣傳為‘我們發(fā)現(xiàn)了一種讓信用記錄薄弱的人也可以入場的方式’,”帕斯奎爾說,“對此我持懷疑態(tài)度。我覺得你們只會看到現(xiàn)有的信用等級制度更加森嚴。”
Moven總裁塞恩說,對社交網(wǎng)絡信息和其它非傳統(tǒng)數(shù)據(jù)源的使用也許會讓算法變的更具個人針對性,否則算法就只能靠更加零散的數(shù)據(jù)來判斷一個借款人的行為?!吧缃粩?shù)據(jù)讓重心重回‘人’本身,說到底,如果你這個人不靠譜,那么你就是筆不良貸款?!?/span>
在亞特蘭大,約翰遜說,他終究還是抱有這樣的希望:新的技術能被用于為借款人創(chuàng)造機會,而不會加劇對他們的偏見。
“事情有好的一面,也有壞的一面,”約翰遜說,“我的經(jīng)歷就是一個真實的例子,表明事情有壞的一面,也表明很多人往往根本就不知道事情還有壞的一面。”
算法數(shù)據(jù):需要法律界定的新評分系統(tǒng)
上世紀50年代中期,威廉?費爾(William Fair)和厄爾?艾薩克(Earl Isaac)將第一代數(shù)據(jù)驅動消費者評分系統(tǒng)賣給了密蘇里州圣路易斯的一家投資公司。他們的”FICO”評分得名于兩人創(chuàng)辦的公司Fair Isaac Corporation名稱的縮寫。這個評分體系之后將隨著計算機的發(fā)展,普遍應用于整個美國信貸業(yè)。
1995年,美國政府住房融資機構房地美(Freddie Mac)和房利美(Fannie Mae)接受了信用評分,將其納入了抵押貸款核發(fā)流程,嵌入了美國金融體系的底層紋理之中。到2000年,超過75%的住房抵押貸款使用了FICO評分。2015年,F(xiàn)air Isaac公司表示90%以上的放貸決策都參考了FICO評分。
幾十年來,F(xiàn)ICO評分都是保密的。它決定了借款人的信用,借款人卻基本不清楚它的具體情況。直到2004年,美國政府才要求消費者報告機構在消費者提出要求時,提供詳細的信用評分信息。
在世界隱私論壇(World Privacy Forum)委托撰寫的一份研究報告中,帕姆?狄克遜(Pam Dixon)和鮑勃?格爾曼(Bob Gellman)提出,現(xiàn)在的新一代由算法驅動的消費者信用評分,與上世紀50年代的FICO評分一樣,法律地位模糊不清。
“數(shù)據(jù)中間商、商家、政府機構和其他人,不用知會消費者,就可以創(chuàng)建和使用他們的消費者評分,”他們寫道。
“針對信用評分的法律,往往無法為新的消費者評分提供保護?!?/span>
對很多貸款機構來說,收集非傳統(tǒng)數(shù)據(jù)不過是嘗試補充或者取代傳統(tǒng)信用評分模式,這種模式仍然主要依靠歷史信息,批評者認為歷史信息并不能很好地反映一個人的信用。FICO評分的最大組成部分是付款記錄。人們認為已經(jīng)是時候用新方法打破這種依賴歷史信息的評分方式了。
“FICO評分會導致誤報和漏報,”非傳統(tǒng)貸款機構OnDeck的創(chuàng)始人米奇?雅各布斯(Mitch Jacobs)表示。該公司使用自己的數(shù)據(jù)驅動系統(tǒng)來發(fā)放小企業(yè)貸款。“一個經(jīng)營了十年、客戶眾多、現(xiàn)金流良好的公司,卻可能看起來信用不好。”
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03