
互聯(lián)網(wǎng)+大數(shù)據(jù)模式下的征信
技術(shù)變革對(duì)征信業(yè)的發(fā)展起到了非常大的促進(jìn)作用。征信最早起源于消費(fèi)分期,需要對(duì)消費(fèi)者進(jìn)行信用評(píng)估,但當(dāng)時(shí)更多的是通過(guò)口碑積累的定性判斷,沒(méi)有定量描述。進(jìn)入電子化時(shí)代后,數(shù)據(jù)得到了沉淀和積累,我們開(kāi)始使用數(shù)據(jù)統(tǒng)計(jì)模型來(lái)計(jì)算和評(píng)估信用,這極大地推動(dòng)了行業(yè)快速向前發(fā)展。在今天的互聯(lián)網(wǎng)時(shí)代,數(shù)據(jù)承載量非常大,任何數(shù)據(jù)都可以成為信用的一部分,即我們可以利用數(shù)據(jù)與信用的關(guān)聯(lián)度,深層次挖掘信用數(shù)據(jù)。人工智能算法模型不止是對(duì)過(guò)去的統(tǒng)計(jì),也包括對(duì)未來(lái)的預(yù)測(cè),它可以幫助我們更好地刻畫(huà)違約概率和信用狀況。
芝麻信用是在大數(shù)據(jù)互聯(lián)網(wǎng)模式下建立的征信系統(tǒng)。阿里巴巴從十年前開(kāi)始發(fā)展電子商務(wù)時(shí),就把信用體系建設(shè)作為最重要的一環(huán),但最近幾年我們才真正開(kāi)始進(jìn)入征信行業(yè),還是新兵。芝麻信用的logo上有句標(biāo)語(yǔ)——“點(diǎn)滴珍貴,重在積累”,這是我們認(rèn)為信用應(yīng)有的內(nèi)涵。芝麻是很有營(yíng)養(yǎng)的食物,每粒芝麻都不大,但通過(guò)點(diǎn)滴積累,將有益于社會(huì)的健康發(fā)展。
互聯(lián)網(wǎng)+大數(shù)據(jù)征信:廣泛、多維、實(shí)時(shí)
首先,征信人群覆蓋廣泛,可作為征信體系有效補(bǔ)充。人民銀行征信中心在征信數(shù)據(jù)方面做得非常出色,有效地解決了信用風(fēng)險(xiǎn)問(wèn)題,幫助金融行業(yè)持續(xù)健康發(fā)展,大大提高了金融的獲得性。同時(shí)我們也看到,目前只有不到4億人在央行征信系統(tǒng)有信用記錄,還有很多人沒(méi)有信用記錄數(shù)據(jù),在獲得金融服務(wù)時(shí),存在一定的門(mén)檻。中國(guó)有6.48億網(wǎng)民,人群覆蓋面非常廣,通過(guò)對(duì)他們?cè)诰W(wǎng)絡(luò)上留下的痕跡進(jìn)行數(shù)據(jù)挖掘和分析,能夠?qū)δ壳暗恼餍艩顩r進(jìn)行有效補(bǔ)充,讓更多在互聯(lián)網(wǎng)上有數(shù)據(jù)的人,通過(guò)刻畫(huà)得出的信用狀況,也能得到金融服務(wù),當(dāng)然還包括生活服務(wù)。
其次,征信信息廣譜多維?,F(xiàn)有征信記錄主要是個(gè)人信息加信貸記錄,而互聯(lián)網(wǎng)上的行為記錄非常多,我們可以用大數(shù)據(jù)的方法計(jì)算互聯(lián)網(wǎng)上萬(wàn)個(gè)變量,將更多信用記錄以外的信息納入征信體系。結(jié)合現(xiàn)有身份記錄和信貸記錄,以及生活類(lèi)數(shù)據(jù),再加上互聯(lián)網(wǎng)數(shù)據(jù),可以得到更多廣譜信息來(lái)刻畫(huà)信用。
最后,征信數(shù)據(jù)實(shí)時(shí)鮮活。大數(shù)據(jù)的兩個(gè)主要特點(diǎn)是存量、熱數(shù)據(jù),它不再是離線的事后分析數(shù)據(jù),而是在線實(shí)時(shí)的互動(dòng)數(shù)據(jù)。如果某個(gè)人有違約行為記錄,會(huì)立刻被刻畫(huà)進(jìn)來(lái),使當(dāng)前業(yè)務(wù)的快速?zèng)Q策更加有效。
運(yùn)用大數(shù)據(jù)征信模型全面刻畫(huà)信用
信用是一筆巨大的資產(chǎn),讓它成為一個(gè)可衡量、可變現(xiàn)的資產(chǎn)是我們的愿景。我們的優(yōu)勢(shì)在于互聯(lián)網(wǎng)數(shù)據(jù),但不僅指交易數(shù)據(jù)。多年來(lái),用戶通過(guò)第三方支付繳納水電煤氣費(fèi)、信用卡還款以及物流信息也是重要的數(shù)據(jù)來(lái)源。當(dāng)然,公共政務(wù)數(shù)據(jù)也很重要,此外還有用戶自主上傳的數(shù)據(jù)。這些數(shù)據(jù)能夠幫助我們更好地描述以及準(zhǔn)確地刻畫(huà)個(gè)人信用。我們輸出的是信用分,基于數(shù)據(jù)來(lái)構(gòu)建決策引擎,以便向用戶輸出更有價(jià)值的服務(wù)。
大數(shù)據(jù)征信模型與傳統(tǒng)評(píng)分體系有所不同。我們深度融合了傳統(tǒng)信用評(píng)估與創(chuàng)新信用評(píng)估,開(kāi)創(chuàng)了大數(shù)據(jù)征信模型。在模型中,信用歷史是非常重要的一項(xiàng),其他維度包括身份特質(zhì)、履約能力、行為偏好和人脈關(guān)系(此項(xiàng)分?jǐn)?shù)比重稍低)。通過(guò)這五大維度,我們建立了刻畫(huà)個(gè)人信用全貌的模型。我們的主要切入點(diǎn)在于,使普通老百姓(603883,股吧)感受到信用的力量和價(jià)值,使他們今后在生活中注意培養(yǎng)信用意識(shí),并在全社會(huì)建立起信用文化。
凈化互聯(lián)網(wǎng)環(huán)境
在合法合規(guī)的前提下,大數(shù)據(jù)征信公司應(yīng)科學(xué)客觀公正地評(píng)價(jià)個(gè)人的信用水平,通過(guò)輸出各種標(biāo)準(zhǔn)化和定制化的身份識(shí)別、反欺詐、信用風(fēng)險(xiǎn)識(shí)別與跟蹤產(chǎn)品與服務(wù),賦能合作伙伴,并一起推動(dòng)中國(guó)誠(chéng)信文化的傳播和誠(chéng)信體系的構(gòu)建。
基于大數(shù)據(jù)7×24小時(shí)在線運(yùn)算能力,芝麻信用有非常強(qiáng)大的身份識(shí)別和反欺詐能力,能夠以商業(yè)化的方法凈化互聯(lián)網(wǎng)環(huán)境。隨著生物識(shí)別技術(shù)的發(fā)展,生物特征的識(shí)別率、準(zhǔn)確性、可靠性可以大大提高,再輔之其他識(shí)別方法,可以非常精準(zhǔn)、可靠地識(shí)別人,這樣就能將人與賬戶和設(shè)備關(guān)聯(lián)起來(lái)?;谶@套識(shí)別體系,能夠充分了解網(wǎng)上的行為主體。今年3月,我們?cè)诘聡?guó)展示了人臉識(shí)別技術(shù),我們的樣本非常大,識(shí)別可靠性也不錯(cuò),我們對(duì)此抱以期待。
另外,通過(guò)賬戶行為分析,我們能夠準(zhǔn)確地刻畫(huà)人的行為,以此判斷是否出現(xiàn)行為異常,帶來(lái)安全隱患,幫助合作伙伴進(jìn)行反欺詐識(shí)別。未來(lái),反欺詐將回到“以人為本”,而不是以賬號(hào)為中心。線下查詢信用一定要本人持身份證來(lái)操作,身份識(shí)別對(duì)網(wǎng)上查詢來(lái)說(shuō)也很關(guān)鍵,確認(rèn)是否本人非常重要,我們?cè)谶@方面有強(qiáng)大的手段。
我們的目標(biāo)是,構(gòu)建賦能商業(yè)與金融機(jī)構(gòu)的開(kāi)放式大數(shù)據(jù)平臺(tái)。上層是不同機(jī)構(gòu),中層是通過(guò)解決方案進(jìn)行決策引擎,下面是通過(guò)大數(shù)據(jù)和模型,在取得授權(quán)的情況下,開(kāi)發(fā)基于行業(yè)的應(yīng)用。這是一個(gè)持續(xù)學(xué)習(xí)及沉淀經(jīng)驗(yàn)的平臺(tái),提供了很多可以不斷細(xì)化的工具,并且是實(shí)時(shí)監(jiān)控的專(zhuān)業(yè)級(jí)數(shù)據(jù)安全管理。此外,基于云平臺(tái)的計(jì)算,需要做好云端數(shù)據(jù)安全管理。我們不僅輸出信用分或征信報(bào)告,更是搭建了一個(gè)開(kāi)放數(shù)據(jù)共創(chuàng)的云計(jì)算平臺(tái),并基于云平臺(tái)來(lái)構(gòu)建數(shù)據(jù)的決策引擎體系,幫助合作伙伴實(shí)現(xiàn)商業(yè)目的。
開(kāi)放政務(wù)信息源 加快信用領(lǐng)域立法
對(duì)于央行大力促進(jìn)征信行業(yè)的發(fā)展,推動(dòng)社會(huì)征信體系的建設(shè),我們舉雙手贊成。同時(shí),我們也提出兩點(diǎn)建議。
首先,開(kāi)放政務(wù)信用信息源。開(kāi)放數(shù)據(jù)將產(chǎn)生巨大的社會(huì)價(jià)值,我認(rèn)為,可以向符合資格的機(jī)構(gòu)開(kāi)放信息源,這些機(jī)構(gòu)取得了國(guó)家許可執(zhí)照,便于接受監(jiān)管。如果他們能真正用市場(chǎng)化手段把這些數(shù)據(jù)運(yùn)用起來(lái),并回饋社會(huì),將產(chǎn)生非常大的社會(huì)價(jià)值。
其次,信用領(lǐng)域立法應(yīng)當(dāng)平衡公民隱私保護(hù)與個(gè)人信息數(shù)據(jù)合法利用。這將使征信機(jī)構(gòu)的業(yè)務(wù)開(kāi)展有法可依,有利于征信行業(yè)的長(zhǎng)遠(yuǎn)健康發(fā)展,促進(jìn)社會(huì)信用體系建設(shè)。同時(shí),政府的立法能夠提升普通民眾對(duì)征信行業(yè)的了解、接納和信任程度,為征信行業(yè)的發(fā)展?fàn)I造有利的大環(huán)境。無(wú)論法律細(xì)節(jié)完善與否,芝麻信用都會(huì)充分重視保護(hù)用戶的隱私與合法權(quán)益。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10