
大數(shù)據(jù)時代,電商和團購業(yè)務的用戶行為分析
大數(shù)據(jù)可說是2015年和2016年的重點話題,一方面成為互聯(lián)網(wǎng)和資本市場的火熱話題與風口,另一方面國務院也在《關于印發(fā)促進大數(shù)據(jù)發(fā)展行動綱要的通知》系統(tǒng)部署了全國大數(shù)據(jù)發(fā)展工作,大數(shù)據(jù)儼然成為國家層級的重點戰(zhàn)略。而和金融業(yè)息息相關的數(shù)據(jù)應用方面來說,國務院在隨后頒布的《推進普惠金融發(fā)展規(guī)劃(2016~2020年)》中更是直接提到“鼓勵金融機構運用大數(shù)據(jù)、云計算等新興信息技術,打造互聯(lián)網(wǎng)金融服務平臺”。至此,國內(nèi)外各金融與類金融機構、互聯(lián)網(wǎng)金融企業(yè)紛紛上馬 大數(shù)據(jù)應用 的探索,冀望大數(shù)據(jù)可以帶來技術上的突破,實現(xiàn)自動化、著手升級現(xiàn)有風控模型體系、探索新型態(tài)基于場景化的消費金融市場、提升催收效率、建設互聯(lián)網(wǎng)深層次大面積獲客能力,從而徹底提升國家金融行業(yè)的國際競爭力。
大數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)的差異
談到大數(shù)據(jù),首先應當了解,對金融行業(yè)來說,大數(shù)據(jù)“大”在哪里,和傳統(tǒng)數(shù)據(jù)在本質(zhì)上有什么樣的不同,才能夠更好地理解和更有針對性地應用這寶貴的新資源。就如同原油也需要經(jīng)過層層的提煉,才能成為人類可以大量應用的石油產(chǎn)品,大數(shù)據(jù)也需要經(jīng)過精心的篩選和應用設計,才能起到實質(zhì)的功效。
傳統(tǒng)金融機構,在建設信用風險打分模型的數(shù)據(jù)來源主要有幾個方面:第一,人民銀行征信中心數(shù)據(jù);第二,客戶自己提交的外部個人財力證明數(shù)據(jù),如房產(chǎn)證、汽車行駛證、單位開具的收入證明等;第三,金融機構或集團內(nèi)部積累的客戶歷史數(shù)據(jù),如銀行的工資流水,歷史貸款數(shù)據(jù),保險數(shù)據(jù)等。
傳統(tǒng)數(shù)據(jù)的優(yōu)點和缺點
傳統(tǒng)數(shù)據(jù)優(yōu)點是這些數(shù)據(jù)和金融的價值相關性高、數(shù)據(jù)采集規(guī)范。然而缺點是維度較小,并且覆蓋的人群有限,對于新形態(tài)的互聯(lián)網(wǎng)模式適應程度較差,也不容易達到普惠覆蓋的目的。 金融機構基于這些高價值數(shù)據(jù),紛紛設計出各種信用風險評分模型,最終實現(xiàn)對客戶信用風險的打分評估,是目前較為成熟的運行方式。
大數(shù)據(jù)的特點
大數(shù)據(jù)時代 的客戶信息渠道更加多元化,主要包括內(nèi)部收集和外部渠道,內(nèi)部收集指各互聯(lián)網(wǎng)生態(tài)體系內(nèi),長期積累的用戶數(shù)據(jù)。外部渠道則是指各種數(shù)據(jù)源采集,如通信數(shù)據(jù)、社保數(shù)據(jù)、法院失信數(shù)據(jù)、交通數(shù)據(jù)、保險數(shù)據(jù)等等。
其數(shù)據(jù)特征包括幾個方面,第一,數(shù)據(jù)覆蓋面廣。各大互聯(lián)網(wǎng)集團,通過各種APP采集積累了用戶行為各方面的數(shù)據(jù),如搜素歷史數(shù)據(jù)、電商交易數(shù)據(jù)、支付交易數(shù)據(jù)、社交數(shù)據(jù),以及各種APP采集的用戶行為數(shù)據(jù)等等。第二,大量非結(jié)構化的破碎數(shù)據(jù)導致的數(shù)據(jù)不準確。數(shù)據(jù)采集渠道的多元化和非標準化,隨之帶來的問題就是,客戶信息不準確,同一客戶不同維度的信息經(jīng)常不完整或匹配不上。第三,數(shù)據(jù)來源不穩(wěn)定。不少大數(shù)據(jù)采集通過灰色渠道收集個人隱私數(shù)據(jù),數(shù)據(jù)連續(xù)性和可持續(xù)性欠佳,往往有數(shù)據(jù)過時或缺失問題。第四,消費數(shù)據(jù)和信用數(shù)據(jù)關聯(lián)性弱。
盡管市場上常見的大數(shù)據(jù)機構收集了各種維度的客戶行為信息,試圖描繪客戶畫像,但消費類的數(shù)據(jù)和客戶信用風險以及還款意愿并不直接相關。目前的大數(shù)據(jù)公司往往缺少內(nèi)部征信數(shù)據(jù)、外部征信數(shù)據(jù)、個人資產(chǎn)數(shù)據(jù)等強金融變量數(shù)據(jù),而集中在客戶衣食住行和社交信息,要直接拿來作為信用風險評分模型的有效性依舊有待考驗??紤]到大數(shù)據(jù)和傳統(tǒng)金融數(shù)據(jù)的差異性和互補性,所以更多的應該是如何通過模型的設計和提煉,使得這些大數(shù)據(jù)源經(jīng)過提煉,可以從原油變成成品石油般廣為應用。
大數(shù)據(jù)在借貸中的應用
借貸反欺詐的應用
由于網(wǎng)絡借貸和傳統(tǒng)金融面對的受眾區(qū)別,借款人主要來自線上,考慮到目前網(wǎng)絡犯罪的試錯成本極低,為數(shù)眾多的網(wǎng)絡借貸平臺很容易成為詐騙集團覬覦的目標,一般根據(jù)行業(yè)經(jīng)驗,網(wǎng)絡借貸平臺往往都會有高達九成的借款需求存在欺詐和騙貸行為風險。因此借貸反欺詐的重點在于從100名潛在借款人當中,準確識別出真正有還款意愿的10名借款人。
通過技術的防范手段很多元化,一般通過核實手機號、身份證號碼、電腦唯一設備號、手機唯一設備號,可以進行下列過濾識別手段:交叉比對借款人登記的住家地址、公司地址,以及申請人當時申請的定位地點,如果差距超過10公里,風險系數(shù)極高;某些地址或大樓,屬于申請詐騙高發(fā)地址的,風險系數(shù)偏高,會得到一個分值;發(fā)現(xiàn)和多個平臺同時存在借款記錄的,風險系數(shù)偏高;手機號屬于法院黑名單、租車黑名單、使用時間段不足6個月、被多次標記惡意騷擾電話等,風險系數(shù)偏高;6個月內(nèi),同一個手機設備號,曾經(jīng)在銀行、小貸公司、多家P2P平臺有過多次申請記錄的,風險系數(shù)極高;手機設備號近一天關聯(lián)申請人3個手機號以上的,風險系數(shù)極高;手機號與設備是否匹配、第一次激活時間距離申請貸款時間較近,風險系數(shù)較高。
基于大數(shù)據(jù)自動化流程提升效率
在通過反欺詐引擎,識別出真正有還款意愿的借款人后,這個階段的重點在于建立大數(shù)據(jù)輔助的信用風險評分模型,盡可能的從多維度數(shù)據(jù)補強出傳統(tǒng)金融數(shù)據(jù)不足之處,精準定位達不到傳統(tǒng)金融機構要求,但是又具有良好還款能力的借款人。目前行業(yè)內(nèi)流行較廣的應用是在個人征信過程中,針對小額度(低于1萬元)的貸款需求盡量采取自動化、批量化的模型審批系統(tǒng),將原先需要人工花費30分鐘、逐一審核的15個風險控制點,采取自動化和接口的方式,在1分鐘內(nèi)能完成風險定價和放貸,極大地提升運營的效率,更有效地通過技術手段壓縮了運營成本。不過針對大金額的借貸,考慮到欺詐風險和成本較高,傳統(tǒng)的金融征信數(shù)據(jù)和手段依舊不可或缺,同時使用大數(shù)據(jù)進一步提升風險管控和提高效率,例如通過接口自動實現(xiàn)身份證、法院、社保的信息核實,可以提高準確率和審批效率。未來也可以試圖在傳統(tǒng)風控打分模型中引入更多的大數(shù)據(jù)元素,作為評級的參考標準,例如有金融參考性的保險數(shù)據(jù)、航空記錄、社保記錄等。
構建基于場景的數(shù)據(jù)風險管理體系
通過建設交易借貸的場景一體化,是目前各大互聯(lián)網(wǎng)金融平臺和傳統(tǒng)金融機構進行錯位競爭的舞臺。其中由于借款人是直接通過信用借貸行為取得所想要的產(chǎn)品或服務,套現(xiàn)詐騙風險相對較低,金額一般也較小,各大平臺借鑒著靈活的體系和快速執(zhí)行力,紛紛投入精力設計各種低風險、場景化的金融應用服務,并不斷持續(xù)優(yōu)化客戶體驗。
場景化金融的風險管理要素,在任何一個的場景中,都有借款人、貸款用途(購買特定產(chǎn)品和服務)、資金流和產(chǎn)品服務流這幾個基本要素,在這些特定點中,通過下列規(guī)則的設定和組合,可以有效的極大的降低風險。第一,基于購買特定產(chǎn)品和服務類場景的借貸產(chǎn)品,例如產(chǎn)品服務非一次性交付,如長達一年的教育課程培訓套餐或多次實施的醫(yī)療美容套餐。第二,資金流和產(chǎn)品服務流形成閉環(huán),意味著借款人不能拿到現(xiàn)金,平臺的資金流是直接付給產(chǎn)品服務提供方,如在線分期購買iPhone、個人二手車消費貸款。第三,風險可控有抵押需要快速周轉(zhuǎn)靈活調(diào)度資金的場景,如二手車商的經(jīng)營貸款、房地產(chǎn)置換的贖樓貸,也是很好的消費場景。
不過考慮到每個場景設定的不同,對應的風控要素自然也不同,最理想的互聯(lián)網(wǎng)金融平臺模式,會建立數(shù)十種不同的場景化金融,針對每個場景定義出不同的風控要素、準入條件和禁入人群、利率定價、還款周期等等。
從實操的角度來說,第一步應該是在每一個風控場景,由風控人員和技術人員設定出精密的各種金融要素條件,第二步是盡量善用外部數(shù)據(jù)源來輔助,能真正體現(xiàn)每一個互聯(lián)網(wǎng)金融平臺的產(chǎn)品設計和風控水平。
做催收貸后管理的應用
在傳統(tǒng)數(shù)據(jù)受限的場景下,大數(shù)據(jù)能顯著提升貸后催收的成果,目前國內(nèi)各大銀行信用卡中心都已經(jīng)開始探索這方面的應用,互聯(lián)網(wǎng)金融行業(yè)也早就已經(jīng)著手使用。具體來說,主流應用是查找逾期失聯(lián)客戶的電話、地址、郵箱、QQ 、微信、微博等信息。幫助委托方與失聯(lián)客戶建立溝通渠道。如果還是失敗,大數(shù)據(jù)公司往往會進一步分析該手機號最常聯(lián)系人,做進一步聯(lián)系,試圖聯(lián)系失聯(lián)客戶。
在獲客和客戶價值挖掘上的應用
傳統(tǒng)金融機構或銀行,目前評價一個客戶價值,相對來說較為片面。舉例來說,一個客戶在某銀行里,只有一張借記卡,沒有其他信用卡或貸款服務,只有賬戶里面幾千元活存,那這個客戶對銀行來說,往往被定義為交易不活躍的低價值客戶。
如果可以通過大數(shù)據(jù)角度來看,通過身份證號、手機號進行客戶畫像描繪后,可能分析出來這個客戶經(jīng)常關注互聯(lián)網(wǎng)理財,經(jīng)常頻繁使用各種股票和銀行APP,較高頻次的國內(nèi)和國際航空記錄。這個時候分析出來的結(jié)果反而可能是高凈值客戶。通過大數(shù)據(jù)可以幫助金融機構和互聯(lián)網(wǎng)金融把客戶畫像描繪的更加完整。這樣一來,結(jié)合了原先的傳統(tǒng)情景和 大數(shù)據(jù)分析 后的場景,金融機構和互聯(lián)網(wǎng)金融平臺的決策就會截然不同。這個客戶雖然在銀行或互聯(lián)網(wǎng)金融平臺暫時是一個低價值客戶,但實質(zhì)上是一個高凈值客戶,可以通過適當推送的產(chǎn)品組合,并結(jié)合電話銷售,推薦適合的金融產(chǎn)品或服務,例如,全家海外旅游分期貸款,或者短期高收益的金融產(chǎn)品。這也是通過 大數(shù)據(jù)分析 能改變傳統(tǒng)獲客和客戶挖掘交叉營銷的模式。
同時,通過算法的分析和訓練,可以建立現(xiàn)有用戶的群組,分析出一群比較相似的人,推薦一些他們經(jīng)常會選擇的東西,根據(jù)這些信息可以去推薦相應的金融產(chǎn)品或服務給他,一方面讓客戶覺得不會干擾,進而提升接受度和轉(zhuǎn)化率。從智能推薦的角度,會利用不同的標簽參數(shù)、ID的參數(shù)等等完成推薦的工作。ID在整個數(shù)字營銷領域是非常關鍵的一件事情,需要知道這是同一個人,才會有意義,不然所有營銷的工作都是分散、割裂的,對整體的營銷效果并不會很好。
有了相對穩(wěn)定的老客戶,那如何開發(fā)新客戶進行獲客?很多互聯(lián)網(wǎng)平臺往往會外包給一些外部營銷公司、媒體公司。其實從大數(shù)據(jù)的視角來看,應該是分析現(xiàn)有的穩(wěn)定老客戶,根據(jù)這些老客戶可以通過相似的推薦、相似的選擇找到什么樣的用戶會發(fā)生轉(zhuǎn)化,根據(jù)標簽設定找到已經(jīng)轉(zhuǎn)化的老用戶相似的用戶,根據(jù)這些用戶選擇性的去投放不同的媒體渠道和屬性,不停優(yōu)化整個投放的結(jié)果,可以有效的降低獲客成本。
挖掘POS流水的價值
通過挖掘POS流水的歷史交易數(shù)據(jù),也是一種新的趨勢。一種是通過分析商戶POS機的歷史交易記錄流水,綜合分析所在行業(yè)、月均交易額、交易額穩(wěn)定性、交易變化趨勢、客均消費金額、持續(xù)經(jīng)營時間,實時評測其收入和還貸能力,最后得到一個商戶預授信額度。另外一種是分析個人多張銀行卡的流水,從月均收入和消費金額、消費大類分布、資產(chǎn)狀況、特殊類別統(tǒng)計、銀行卡等級、常駐城市,最后生成持卡人預授信額度。
就如同人類從發(fā)現(xiàn)石油,將石油精煉出煤油,為世界人民帶來夜晚的光明。隨后又將更進一步的提煉出今天廣為全世界使用的汽油和柴油,徹底改變了人類的生活。大數(shù)據(jù)亦然,也會從傳統(tǒng)數(shù)據(jù),升級為大數(shù)據(jù),進一步再升級為結(jié)構化的全數(shù)據(jù)時代,將會徹底改變?nèi)祟愑^察世界、運作世界的方式。
從金融行業(yè)來看,各家大數(shù)據(jù)供應商的數(shù)據(jù),隨著采集設備和種類的增加,采集方式日漸結(jié)構化,輔以各種大數(shù)據(jù)分析工具的齊備、大數(shù)據(jù)分析從業(yè)人員增加,可以預期在不久的將來,大數(shù)據(jù)將會漸漸的徹底改變目前整體傳統(tǒng)金融行業(yè)的運作方式,隨之而來的,各金融機構在戰(zhàn)規(guī)劃略和資源傾斜上,也會越來越重視大數(shù)據(jù)的投入,并逐步將數(shù)據(jù)的積累、分析、應用變成金融機構核心競爭力的一部分。在國內(nèi),除了借貸業(yè)務外,預期在保險行業(yè)、券商行業(yè)、大資管與財富管理行業(yè),還存在著巨大的發(fā)展空間和機遇等著各類金融機構進行探索。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03