
大數(shù)據(jù)時代,電商和團購業(yè)務的用戶行為分析
大數(shù)據(jù)可說是2015年和2016年的重點話題,一方面成為互聯(lián)網(wǎng)和資本市場的火熱話題與風口,另一方面國務院也在《關于印發(fā)促進大數(shù)據(jù)發(fā)展行動綱要的通知》系統(tǒng)部署了全國大數(shù)據(jù)發(fā)展工作,大數(shù)據(jù)儼然成為國家層級的重點戰(zhàn)略。而和金融業(yè)息息相關的數(shù)據(jù)應用方面來說,國務院在隨后頒布的《推進普惠金融發(fā)展規(guī)劃(2016~2020年)》中更是直接提到“鼓勵金融機構運用大數(shù)據(jù)、云計算等新興信息技術,打造互聯(lián)網(wǎng)金融服務平臺”。至此,國內外各金融與類金融機構、互聯(lián)網(wǎng)金融企業(yè)紛紛上馬 大數(shù)據(jù)應用 的探索,冀望大數(shù)據(jù)可以帶來技術上的突破,實現(xiàn)自動化、著手升級現(xiàn)有風控模型體系、探索新型態(tài)基于場景化的消費金融市場、提升催收效率、建設互聯(lián)網(wǎng)深層次大面積獲客能力,從而徹底提升國家金融行業(yè)的國際競爭力。
大數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)的差異
談到大數(shù)據(jù),首先應當了解,對金融行業(yè)來說,大數(shù)據(jù)“大”在哪里,和傳統(tǒng)數(shù)據(jù)在本質上有什么樣的不同,才能夠更好地理解和更有針對性地應用這寶貴的新資源。就如同原油也需要經(jīng)過層層的提煉,才能成為人類可以大量應用的石油產(chǎn)品,大數(shù)據(jù)也需要經(jīng)過精心的篩選和應用設計,才能起到實質的功效。
傳統(tǒng)金融機構,在建設信用風險打分模型的數(shù)據(jù)來源主要有幾個方面:第一,人民銀行征信中心數(shù)據(jù);第二,客戶自己提交的外部個人財力證明數(shù)據(jù),如房產(chǎn)證、汽車行駛證、單位開具的收入證明等;第三,金融機構或集團內部積累的客戶歷史數(shù)據(jù),如銀行的工資流水,歷史貸款數(shù)據(jù),保險數(shù)據(jù)等。
傳統(tǒng)數(shù)據(jù)的優(yōu)點和缺點
傳統(tǒng)數(shù)據(jù)優(yōu)點是這些數(shù)據(jù)和金融的價值相關性高、數(shù)據(jù)采集規(guī)范。然而缺點是維度較小,并且覆蓋的人群有限,對于新形態(tài)的互聯(lián)網(wǎng)模式適應程度較差,也不容易達到普惠覆蓋的目的。 金融機構基于這些高價值數(shù)據(jù),紛紛設計出各種信用風險評分模型,最終實現(xiàn)對客戶信用風險的打分評估,是目前較為成熟的運行方式。
大數(shù)據(jù)的特點
大數(shù)據(jù)時代 的客戶信息渠道更加多元化,主要包括內部收集和外部渠道,內部收集指各互聯(lián)網(wǎng)生態(tài)體系內,長期積累的用戶數(shù)據(jù)。外部渠道則是指各種數(shù)據(jù)源采集,如通信數(shù)據(jù)、社保數(shù)據(jù)、法院失信數(shù)據(jù)、交通數(shù)據(jù)、保險數(shù)據(jù)等等。
其數(shù)據(jù)特征包括幾個方面,第一,數(shù)據(jù)覆蓋面廣。各大互聯(lián)網(wǎng)集團,通過各種APP采集積累了用戶行為各方面的數(shù)據(jù),如搜素歷史數(shù)據(jù)、電商交易數(shù)據(jù)、支付交易數(shù)據(jù)、社交數(shù)據(jù),以及各種APP采集的用戶行為數(shù)據(jù)等等。第二,大量非結構化的破碎數(shù)據(jù)導致的數(shù)據(jù)不準確。數(shù)據(jù)采集渠道的多元化和非標準化,隨之帶來的問題就是,客戶信息不準確,同一客戶不同維度的信息經(jīng)常不完整或匹配不上。第三,數(shù)據(jù)來源不穩(wěn)定。不少大數(shù)據(jù)采集通過灰色渠道收集個人隱私數(shù)據(jù),數(shù)據(jù)連續(xù)性和可持續(xù)性欠佳,往往有數(shù)據(jù)過時或缺失問題。第四,消費數(shù)據(jù)和信用數(shù)據(jù)關聯(lián)性弱。
盡管市場上常見的大數(shù)據(jù)機構收集了各種維度的客戶行為信息,試圖描繪客戶畫像,但消費類的數(shù)據(jù)和客戶信用風險以及還款意愿并不直接相關。目前的大數(shù)據(jù)公司往往缺少內部征信數(shù)據(jù)、外部征信數(shù)據(jù)、個人資產(chǎn)數(shù)據(jù)等強金融變量數(shù)據(jù),而集中在客戶衣食住行和社交信息,要直接拿來作為信用風險評分模型的有效性依舊有待考驗??紤]到大數(shù)據(jù)和傳統(tǒng)金融數(shù)據(jù)的差異性和互補性,所以更多的應該是如何通過模型的設計和提煉,使得這些大數(shù)據(jù)源經(jīng)過提煉,可以從原油變成成品石油般廣為應用。
大數(shù)據(jù)在借貸中的應用
借貸反欺詐的應用
由于網(wǎng)絡借貸和傳統(tǒng)金融面對的受眾區(qū)別,借款人主要來自線上,考慮到目前網(wǎng)絡犯罪的試錯成本極低,為數(shù)眾多的網(wǎng)絡借貸平臺很容易成為詐騙集團覬覦的目標,一般根據(jù)行業(yè)經(jīng)驗,網(wǎng)絡借貸平臺往往都會有高達九成的借款需求存在欺詐和騙貸行為風險。因此借貸反欺詐的重點在于從100名潛在借款人當中,準確識別出真正有還款意愿的10名借款人。
通過技術的防范手段很多元化,一般通過核實手機號、身份證號碼、電腦唯一設備號、手機唯一設備號,可以進行下列過濾識別手段:交叉比對借款人登記的住家地址、公司地址,以及申請人當時申請的定位地點,如果差距超過10公里,風險系數(shù)極高;某些地址或大樓,屬于申請詐騙高發(fā)地址的,風險系數(shù)偏高,會得到一個分值;發(fā)現(xiàn)和多個平臺同時存在借款記錄的,風險系數(shù)偏高;手機號屬于法院黑名單、租車黑名單、使用時間段不足6個月、被多次標記惡意騷擾電話等,風險系數(shù)偏高;6個月內,同一個手機設備號,曾經(jīng)在銀行、小貸公司、多家P2P平臺有過多次申請記錄的,風險系數(shù)極高;手機設備號近一天關聯(lián)申請人3個手機號以上的,風險系數(shù)極高;手機號與設備是否匹配、第一次激活時間距離申請貸款時間較近,風險系數(shù)較高。
基于大數(shù)據(jù)自動化流程提升效率
在通過反欺詐引擎,識別出真正有還款意愿的借款人后,這個階段的重點在于建立大數(shù)據(jù)輔助的信用風險評分模型,盡可能的從多維度數(shù)據(jù)補強出傳統(tǒng)金融數(shù)據(jù)不足之處,精準定位達不到傳統(tǒng)金融機構要求,但是又具有良好還款能力的借款人。目前行業(yè)內流行較廣的應用是在個人征信過程中,針對小額度(低于1萬元)的貸款需求盡量采取自動化、批量化的模型審批系統(tǒng),將原先需要人工花費30分鐘、逐一審核的15個風險控制點,采取自動化和接口的方式,在1分鐘內能完成風險定價和放貸,極大地提升運營的效率,更有效地通過技術手段壓縮了運營成本。不過針對大金額的借貸,考慮到欺詐風險和成本較高,傳統(tǒng)的金融征信數(shù)據(jù)和手段依舊不可或缺,同時使用大數(shù)據(jù)進一步提升風險管控和提高效率,例如通過接口自動實現(xiàn)身份證、法院、社保的信息核實,可以提高準確率和審批效率。未來也可以試圖在傳統(tǒng)風控打分模型中引入更多的大數(shù)據(jù)元素,作為評級的參考標準,例如有金融參考性的保險數(shù)據(jù)、航空記錄、社保記錄等。
構建基于場景的數(shù)據(jù)風險管理體系
通過建設交易借貸的場景一體化,是目前各大互聯(lián)網(wǎng)金融平臺和傳統(tǒng)金融機構進行錯位競爭的舞臺。其中由于借款人是直接通過信用借貸行為取得所想要的產(chǎn)品或服務,套現(xiàn)詐騙風險相對較低,金額一般也較小,各大平臺借鑒著靈活的體系和快速執(zhí)行力,紛紛投入精力設計各種低風險、場景化的金融應用服務,并不斷持續(xù)優(yōu)化客戶體驗。
場景化金融的風險管理要素,在任何一個的場景中,都有借款人、貸款用途(購買特定產(chǎn)品和服務)、資金流和產(chǎn)品服務流這幾個基本要素,在這些特定點中,通過下列規(guī)則的設定和組合,可以有效的極大的降低風險。第一,基于購買特定產(chǎn)品和服務類場景的借貸產(chǎn)品,例如產(chǎn)品服務非一次性交付,如長達一年的教育課程培訓套餐或多次實施的醫(yī)療美容套餐。第二,資金流和產(chǎn)品服務流形成閉環(huán),意味著借款人不能拿到現(xiàn)金,平臺的資金流是直接付給產(chǎn)品服務提供方,如在線分期購買iPhone、個人二手車消費貸款。第三,風險可控有抵押需要快速周轉靈活調度資金的場景,如二手車商的經(jīng)營貸款、房地產(chǎn)置換的贖樓貸,也是很好的消費場景。
不過考慮到每個場景設定的不同,對應的風控要素自然也不同,最理想的互聯(lián)網(wǎng)金融平臺模式,會建立數(shù)十種不同的場景化金融,針對每個場景定義出不同的風控要素、準入條件和禁入人群、利率定價、還款周期等等。
從實操的角度來說,第一步應該是在每一個風控場景,由風控人員和技術人員設定出精密的各種金融要素條件,第二步是盡量善用外部數(shù)據(jù)源來輔助,能真正體現(xiàn)每一個互聯(lián)網(wǎng)金融平臺的產(chǎn)品設計和風控水平。
做催收貸后管理的應用
在傳統(tǒng)數(shù)據(jù)受限的場景下,大數(shù)據(jù)能顯著提升貸后催收的成果,目前國內各大銀行信用卡中心都已經(jīng)開始探索這方面的應用,互聯(lián)網(wǎng)金融行業(yè)也早就已經(jīng)著手使用。具體來說,主流應用是查找逾期失聯(lián)客戶的電話、地址、郵箱、QQ 、微信、微博等信息。幫助委托方與失聯(lián)客戶建立溝通渠道。如果還是失敗,大數(shù)據(jù)公司往往會進一步分析該手機號最常聯(lián)系人,做進一步聯(lián)系,試圖聯(lián)系失聯(lián)客戶。
在獲客和客戶價值挖掘上的應用
傳統(tǒng)金融機構或銀行,目前評價一個客戶價值,相對來說較為片面。舉例來說,一個客戶在某銀行里,只有一張借記卡,沒有其他信用卡或貸款服務,只有賬戶里面幾千元活存,那這個客戶對銀行來說,往往被定義為交易不活躍的低價值客戶。
如果可以通過大數(shù)據(jù)角度來看,通過身份證號、手機號進行客戶畫像描繪后,可能分析出來這個客戶經(jīng)常關注互聯(lián)網(wǎng)理財,經(jīng)常頻繁使用各種股票和銀行APP,較高頻次的國內和國際航空記錄。這個時候分析出來的結果反而可能是高凈值客戶。通過大數(shù)據(jù)可以幫助金融機構和互聯(lián)網(wǎng)金融把客戶畫像描繪的更加完整。這樣一來,結合了原先的傳統(tǒng)情景和 大數(shù)據(jù)分析 后的場景,金融機構和互聯(lián)網(wǎng)金融平臺的決策就會截然不同。這個客戶雖然在銀行或互聯(lián)網(wǎng)金融平臺暫時是一個低價值客戶,但實質上是一個高凈值客戶,可以通過適當推送的產(chǎn)品組合,并結合電話銷售,推薦適合的金融產(chǎn)品或服務,例如,全家海外旅游分期貸款,或者短期高收益的金融產(chǎn)品。這也是通過 大數(shù)據(jù)分析 能改變傳統(tǒng)獲客和客戶挖掘交叉營銷的模式。
同時,通過算法的分析和訓練,可以建立現(xiàn)有用戶的群組,分析出一群比較相似的人,推薦一些他們經(jīng)常會選擇的東西,根據(jù)這些信息可以去推薦相應的金融產(chǎn)品或服務給他,一方面讓客戶覺得不會干擾,進而提升接受度和轉化率。從智能推薦的角度,會利用不同的標簽參數(shù)、ID的參數(shù)等等完成推薦的工作。ID在整個數(shù)字營銷領域是非常關鍵的一件事情,需要知道這是同一個人,才會有意義,不然所有營銷的工作都是分散、割裂的,對整體的營銷效果并不會很好。
有了相對穩(wěn)定的老客戶,那如何開發(fā)新客戶進行獲客?很多互聯(lián)網(wǎng)平臺往往會外包給一些外部營銷公司、媒體公司。其實從大數(shù)據(jù)的視角來看,應該是分析現(xiàn)有的穩(wěn)定老客戶,根據(jù)這些老客戶可以通過相似的推薦、相似的選擇找到什么樣的用戶會發(fā)生轉化,根據(jù)標簽設定找到已經(jīng)轉化的老用戶相似的用戶,根據(jù)這些用戶選擇性的去投放不同的媒體渠道和屬性,不停優(yōu)化整個投放的結果,可以有效的降低獲客成本。
挖掘POS流水的價值
通過挖掘POS流水的歷史交易數(shù)據(jù),也是一種新的趨勢。一種是通過分析商戶POS機的歷史交易記錄流水,綜合分析所在行業(yè)、月均交易額、交易額穩(wěn)定性、交易變化趨勢、客均消費金額、持續(xù)經(jīng)營時間,實時評測其收入和還貸能力,最后得到一個商戶預授信額度。另外一種是分析個人多張銀行卡的流水,從月均收入和消費金額、消費大類分布、資產(chǎn)狀況、特殊類別統(tǒng)計、銀行卡等級、常駐城市,最后生成持卡人預授信額度。
就如同人類從發(fā)現(xiàn)石油,將石油精煉出煤油,為世界人民帶來夜晚的光明。隨后又將更進一步的提煉出今天廣為全世界使用的汽油和柴油,徹底改變了人類的生活。大數(shù)據(jù)亦然,也會從傳統(tǒng)數(shù)據(jù),升級為大數(shù)據(jù),進一步再升級為結構化的全數(shù)據(jù)時代,將會徹底改變人類觀察世界、運作世界的方式。
從金融行業(yè)來看,各家大數(shù)據(jù)供應商的數(shù)據(jù),隨著采集設備和種類的增加,采集方式日漸結構化,輔以各種大數(shù)據(jù)分析工具的齊備、大數(shù)據(jù)分析從業(yè)人員增加,可以預期在不久的將來,大數(shù)據(jù)將會漸漸的徹底改變目前整體傳統(tǒng)金融行業(yè)的運作方式,隨之而來的,各金融機構在戰(zhàn)規(guī)劃略和資源傾斜上,也會越來越重視大數(shù)據(jù)的投入,并逐步將數(shù)據(jù)的積累、分析、應用變成金融機構核心競爭力的一部分。在國內,除了借貸業(yè)務外,預期在保險行業(yè)、券商行業(yè)、大資管與財富管理行業(yè),還存在著巨大的發(fā)展空間和機遇等著各類金融機構進行探索。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10