
作者 | Daniel Faggella
編譯 | CDA數(shù)據(jù)分析師
機(jī)器學(xué)習(xí)在金融領(lǐng)域的出現(xiàn),讓人們對使用AI自動執(zhí)行從欺詐檢測到客戶服務(wù)的流程產(chǎn)生了強(qiáng)烈的興趣。 盡管某些用例的確定性不如其他用例,但我們的研究使我們相信,在未來五年中,銀行將繼續(xù)投資于機(jī)器學(xué)習(xí),以進(jìn)行與風(fēng)險相關(guān)的流程,包括保險業(yè)。
在關(guān)于行業(yè)AI播客的采訪中,我們與ZestFinance的CTO Jay Budzik進(jìn)行了交談,探討了承銷商如何利用基于機(jī)器學(xué)習(xí)的信用模型來贏得更多業(yè)務(wù),并通過利用新的數(shù)據(jù)源來降低風(fēng)險的方式?,F(xiàn)在這些都可以通過數(shù)字方式獲得,并且已經(jīng)成熟,可以用于機(jī)器學(xué)習(xí)模型。
這些模型正在挑戰(zhàn)傳統(tǒng)的信用評分技術(shù),包括FICO評分和簡單的評分卡。 在本文中,我們討論了機(jī)器學(xué)習(xí)如何擴(kuò)展貸方的客戶基礎(chǔ),以涵蓋所謂的“看不見信用”(信用記錄薄弱或沒有信用歷史的人)以及信用評分不能準(zhǔn)確反映其風(fēng)險的人。
我們從新的數(shù)據(jù)源入手:FICO和傳統(tǒng)信用評分的范圍太窄而無法為關(guān)鍵的人口統(tǒng)計數(shù)據(jù)提供服務(wù),而這些人口統(tǒng)計結(jié)果通常都被拒之門外。
在過去的三十年中,F(xiàn)ICO評分和類似的信用評分已成為信用建模的標(biāo)準(zhǔn)。FICO允許銀行,信用卡公司和其他貸方客觀地評估信貸申請人的信譽(yù)。分?jǐn)?shù)是根據(jù)五個因素計算得出的,每個因素都由幾個權(quán)重不同的變量組成,每個變量都占總FICO得分的百分比:
所有這些因素的共同點是,必須事先獲得信貸額度。結(jié)果,傳統(tǒng)的信用評分通常是“隱形信用”進(jìn)入的障礙。根據(jù)美國消費者金融保護(hù)局(CFPB)的數(shù)據(jù),2015年有2600萬看不見信用的美國人,接近十分之一的美國人。此外,CFPB發(fā)現(xiàn)“低收入社區(qū)的消費者更有可能沒有信用記錄或沒有足夠的當(dāng)前信用記錄來產(chǎn)生信用評分?!?/span>
這些人群最有可能需要貸款購買大筆商品,但是由于缺乏信用記錄,因此在承銷商使用傳統(tǒng)信用評分來評估貸款和信用額度時,他們無法獲得貸款和信用額度的批準(zhǔn):這就是Catch-22。
還有一些借款人的信用評分不能準(zhǔn)確反映他們對貸方的風(fēng)險。益百利(Experian)發(fā)現(xiàn),千禧一代的平均信用評分約為638,低于美國全國平均水平,也遠(yuǎn)低于前幾代。該公司承認(rèn),部分原因是這些借款人的年齡;他們的信用記錄很薄,信用記錄占FICO分?jǐn)?shù)的30%。結(jié)果,放貸者可能不批準(zhǔn)它們的貸款,因為它們的分?jǐn)?shù)太低,而實際上卻沒有帶來太大的風(fēng)險。他們還很年輕。
盡管FICO和傳統(tǒng)的信用評分被證明對年紀(jì)較大的中產(chǎn)階級美國人有用,但這些評分對習(xí)慣于使用借記卡購物的千禧一代和低收入美國人而言可能沒有那么大的用處。這些看不見信用的借款人不一定具有風(fēng)險,但是放款人很少批準(zhǔn)它們,因為沒有信用評分,他們的風(fēng)險尚不清楚。
據(jù)該公司稱,F(xiàn)ICO分?jǐn)?shù)不會隨著時間而改變。ZestFinance認(rèn)為,這會使FICO分?jǐn)?shù)很難區(qū)分以下兩個人:
FICO和傳統(tǒng)的信貸模式可能難以解釋這兩個借款人的生活隨時間變化并影響其償債能力的情況。尤其對于年輕人而言,這可能會帶來麻煩,其中許多人正舉債掙扎。
益百利(Experian)在Opploans的一項調(diào)查中報告說,大約四分之一的千禧一代認(rèn)為他們沒有得到良好信譽(yù)的教育。同一項調(diào)查還發(fā)現(xiàn)15%的千禧一代經(jīng)常錯過信用卡付款。
他們可能會在以后的生活中找到自己的財務(wù)基礎(chǔ),從而可以輕松按時付款,但是傳統(tǒng)的信用評分不會立即反映出來。這些借款人可能因為他們年輕時建立的不良信用記錄而難以獲得批準(zhǔn),并且無法開設(shè)信用帳戶將使他們的得分保持較低。再次,這是一個陷阱22。
新的數(shù)據(jù)源可能是解決方案。
根據(jù)Budzik的說法,F(xiàn)ICO分?jǐn)?shù)可能會將一打或兩個變量納入其分?jǐn)?shù):
我們?yōu)榭蛻袅慨a(chǎn)的模型中往往包含數(shù)百或數(shù)千個變量。我們有一個擁有2200個變量的公司,它在從事自動貸款業(yè)務(wù)。
更多的數(shù)據(jù)意味著更細(xì)微的信用模型,這些模型可以使承銷商更準(zhǔn)確地了解貸款申請人是否存在風(fēng)險。新數(shù)據(jù)源可能包括:
這些類別的數(shù)據(jù)將以某種方式通知貸款申請人的信譽(yù),但是傳統(tǒng)的信貸模型并未考慮其中的任何一個。
根據(jù)Budzik:
為了能夠考慮更多的變量,[貸方]需要能夠處理它們的新算法。機(jī)器學(xué)習(xí)提供了解決該問題的方法。ML可以考慮所有這些變量,但不會犯錯誤。傳統(tǒng)的評分技術(shù)會被諸如數(shù)學(xué)的相關(guān)性和局限性之類的東西絆倒。
通過機(jī)器學(xué)習(xí),理論上可計入信用模型的數(shù)據(jù)源數(shù)量是無限的。存在無數(shù)變量可以預(yù)測申請人的還貸能力,并且機(jī)器學(xué)習(xí)擅長在大型數(shù)據(jù)集中查找模式?;贛L的信用模型可能會考慮到尚未知道的數(shù)據(jù)點,以預(yù)測借款人償還其貸款的可能性。
例如,Zest 與Discover合作,利用信用卡公司的消費者支出數(shù)據(jù)庫,為其75億美元的個人貸款業(yè)務(wù)建立了新模式。Zest聲稱該模型評估了數(shù)百個申請人數(shù)據(jù)點,比Discover以前使用的信用模型高出十倍。
據(jù)稱建模者發(fā)現(xiàn),折扣商店購物的歷史增加了申請人獲得個人貸款的機(jī)會,而申請人在貸款申請上寫上雇主的法定全名會降低這種可能性。
從座機(jī)或手機(jī)而不是Skype或其他互聯(lián)網(wǎng)電話服務(wù)致電Discover的申請人被認(rèn)為是更安全的選擇,因為它們更容易追溯到個人。
此外,這些來源的組合本身會創(chuàng)建自己的數(shù)據(jù)點。例如,貸款申請人有時會購買汽車配件的事實可能不會影響他們自行償還汽車貸款的能力。
乙UT這與該申請人要拿出貸款可能表明更低或更高的可能性,申請人將支付那筆貸款后面的車的品牌組合。保險人幾乎不可能弄清這種關(guān)系,但它們在很大程度上是機(jī)器學(xué)習(xí)的價值。
此外,機(jī)器學(xué)習(xí)可能比傳統(tǒng)的信用模型更具適應(yīng)性。開發(fā)新的信貸模型可能需要一年甚至更長的時間,這可能會阻礙銀行跟上不斷變化的經(jīng)濟(jì)形勢的能力。
客戶和市場可以相對快速地變化。一些用于信貸承銷的機(jī)器學(xué)習(xí)軟件帶有自動風(fēng)險管理功能,該軟件可以使貸方在不到一個月的時間內(nèi)對模型進(jìn)行調(diào)整,以便隨著經(jīng)濟(jì)的發(fā)展適應(yīng)其承銷業(yè)務(wù)。
機(jī)器學(xué)習(xí)可以允許銀行和其他貸方通過批準(zhǔn)更多的信用隱性申請人和更多信用評分不完整的信用狀況申請人來增加收入。例如,ZestFinance聲稱已借助基于機(jī)器學(xué)習(xí)的信貸模型幫助Prestige Financial Services將貸款批準(zhǔn)增加了14%。
同時,貸方可能能夠增加收入而又不會增加風(fēng)險。承銷商可以開始拒絕比其信用評分所暗示的風(fēng)險高的貸款申請人。結(jié)果,貸方可以減少從這些借款人那里蒙受的損失。
機(jī)器學(xué)習(xí)還可以實現(xiàn)更準(zhǔn)確的基于風(fēng)險的定價。如前所述,與傳統(tǒng)模型相比,基于ML的信用模型可以處理更多的數(shù)據(jù),從而使申請人的支付能力更加細(xì)致入微。結(jié)果,貸方可以更加細(xì)化他們?yōu)榻杩钊颂峁┑睦省?/span>
ML可以彌補(bǔ)兩個非常相似的借款人之間的微小差異,而這些差異可能值得通過為一個借款人提供更高的利率來加以利用。這樣可以增加每個借款人的利潤率,而不會增加承銷商審查借款人申請的時間。結(jié)果,從規(guī)模上講,貸方可能會看到收入的大幅增長。
依靠新數(shù)據(jù)源的機(jī)器學(xué)習(xí)模型可以以傳統(tǒng)模型完全專注于信用歷史記錄的方式評估信用隱性申請人。基于機(jī)器學(xué)習(xí)的信用模型的結(jié)果是,申請人可能會發(fā)現(xiàn)貸方正在批準(zhǔn)它們,而這是他們以前所沒有的。信用記錄薄弱的年輕人可能能夠建立自己的信用,因為貸方可以開始注冊。
同樣,在未來,千禧一代可能會發(fā)現(xiàn),過去的信用失誤并不能阻止他們在將來更有能力償還貸款時獲得大筆購買的貸款。
另外,Budzik指出:
貸方可以避免這種情況,而不是批準(zhǔn)將要違約的人……通過向無法付款的人提供信貸來制造麻煩,而可以避免這種情況并防止這種情況發(fā)生在消費者身上
如前所述,具有良好信用評分的貸款申請人可能構(gòu)成比其評分所反映的更大的風(fēng)險。分?jǐn)?shù)在700左右并觸犯法律的申請人可能被迫在一年內(nèi)分期付款。這樣的判斷可能會影響申請人償還貸款的能力,影響其信用評分,并給他們的未來造成更長期的損害。
基于機(jī)器學(xué)習(xí)的信用模型會考慮未決的案件,這可能表明承銷商不會完全批準(zhǔn)申請人,即使他們的信用評分表明他們值得貸款。放貸人本質(zhì)上可以通過不首先批準(zhǔn)貸款來對付風(fēng)險較高的消費者拖欠其貸款的風(fēng)險。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10