
利用用戶在線下消費積累的大數(shù)據(jù)創(chuàng)造消費場景
從 淘寶 的 “花唄” 到 京東 的 “京東白條”,再到芝麻科技旗下針對線下零售門店推出的實時導購助手 “知了”、結(jié)合了線下商業(yè)消費數(shù)據(jù)及線上消費軌跡的 “觀星”,似乎大數(shù)據(jù)還被禁錮在互聯(lián)網(wǎng)企業(yè)的圈子內(nèi)。互聯(lián)網(wǎng)大數(shù)據(jù)在于掌握了許多傳統(tǒng)數(shù)據(jù)方及征信方拿不到的數(shù)據(jù),例如在國外,已經(jīng)有公司在分析用戶的 Facebook、LinkedIn 和 Twitter 賬戶來評估他們的信用情況。包括美國的企業(yè)征信巨頭鄧白氏近年的戰(zhàn)略主要有二:增強數(shù)據(jù)挖掘能力,兼并掌握技術的企業(yè);與互聯(lián)網(wǎng)數(shù)據(jù)掌控方戰(zhàn)略合作,共享數(shù)據(jù)。
今年6月,浦發(fā)銀行信用卡中心宣布與騰訊征信開展合作,借助互聯(lián)網(wǎng)大數(shù)據(jù)對客戶消費行為和誠信記錄作出盡可能全面的綜合分析,開展基于互聯(lián)網(wǎng)大數(shù)據(jù)的第三方征信服務,這在傳統(tǒng)金融機構中算得上是第一家。
那么,除了暢想在未來的某一天,企業(yè)可以結(jié)合第三方數(shù)據(jù)、互聯(lián)網(wǎng)大數(shù)據(jù)做更多征信業(yè)務之外,積累了千萬級用戶數(shù)十億條消費信息數(shù)據(jù)的傳統(tǒng)銀行,該如何利用自己原有的業(yè)務數(shù)據(jù)積累做到實際上的線下營銷落地?畢竟,線下的消費數(shù)據(jù)沉淀時間更久,關聯(lián)著的信用卡賬戶甚至還包括許多個人資產(chǎn)證明、工資證明等材料,跟互聯(lián)網(wǎng)企業(yè)相比,省去了線下征信調(diào)查的步驟。
浦發(fā)信用卡中心的首次嘗試的切入點在信用卡,并選擇了 天璣科技 的大數(shù)據(jù)團隊作為解決方案提供商,而在天璣科技背后,更有智樹科技等科技創(chuàng)新公司提供大數(shù)據(jù)技術分析的支撐。除了上述線下數(shù)據(jù)沉淀的優(yōu)勢之外,選擇此次合作,是因為信用卡中心利用大數(shù)據(jù)做業(yè)務落地能挖掘用戶的增量消費需求嗎?
對于這個提問,天璣科技的大數(shù)據(jù)團隊負責人梁晟認為,信用卡的透支功能、用戶消費特征都需要大數(shù)據(jù)做把控,并做實時營銷方案,“信用卡中心是最關注用戶行為、消費習慣,希望用戶多刷卡消費,獲得更多的流量。主要的目的:第一,獲客,拿下增量的客戶群體;第二,爭取讓已有的客戶增加消費。浦發(fā)銀行信用卡的客戶群主要是華東區(qū)的白領,都是收入相對比較高的人群”,這其中的數(shù)據(jù)含金量很高。
梁晟畢業(yè)于復旦大學計算機系,碩士學位,多年來從事金融、運營商的應用架構和咨詢,對大數(shù)據(jù)的實踐落地有著許多獨到見解,并同時帶領團隊選擇了銀行業(yè)這個數(shù)據(jù)價值密度較高的行業(yè),以信用卡業(yè)務作為切入點,在促進信用卡業(yè)務獲客、營收甚至風控等方面,邁出了實踐的一大步。在他看來,信用卡的三大痛點及背后根由,主要分為實時營銷、數(shù)據(jù)關聯(lián)、銀行缺乏落地實踐等,歸納總結(jié)如下:
第一,信用卡交易的數(shù)據(jù)量特別大,用戶量千萬級,用戶歷史信息和記錄數(shù)十億,年交易量超越了十億級。而與之對應的,核心系統(tǒng)還是基于原有的成熟架構的系統(tǒng),主要針對 OLTP 的在線事務處理。原有的核心系統(tǒng)運行穩(wěn)定,但不適合做在線數(shù)據(jù)分析的處理。
通常用戶刷完卡之后,核心系統(tǒng)需要對用戶進行復雜的狀態(tài)計算,才能作出這筆交易成功、或者不成功的判斷,這個過程在系統(tǒng)中必須確保整個事務的完整性。整個計算過程數(shù)據(jù)處理量是多少?速度怎樣?梁晟回答,“大數(shù)據(jù)服務平臺現(xiàn)在做到以單節(jié)點數(shù)萬筆 / 秒規(guī)則匹配。分布式架構是計算集群,原則上可以線性擴展,以時間衡量的話,處理速度為微秒級”。
在判定這筆交易成功后,系統(tǒng)先進行虛擬賬的記錄,可能到當日統(tǒng)一清算時,再記錄會計賬。整個事務處理的復雜性的要求導致核心系統(tǒng)騰不出時間做實時營銷,并且使用的還是傳統(tǒng)的技術架構以及數(shù)據(jù)處理方法。一旦在任何環(huán)節(jié),會計賬或者虛擬賬出現(xiàn)偏差,其錯誤原因的排查往往要耗費大量精力。為了保證數(shù)據(jù)的一致性,銀行信用卡業(yè)務往往相對弱化性能,更難以進行更多的實時營銷支持。
第二,隨著日積月累的數(shù)據(jù)沉淀,核心系統(tǒng)和各類業(yè)務應用系統(tǒng)的數(shù)據(jù)也越來越雜亂,“噪音” 越來越多。數(shù)據(jù)處理系統(tǒng)多,可能每個系統(tǒng)都有分析、數(shù)據(jù)挖掘的功能,但是數(shù)據(jù)必須形成關聯(lián)圈。需要有一個大數(shù)據(jù)的平臺獨立在信用卡核心系統(tǒng)之外,把數(shù)據(jù)進行清洗,更關注用戶、做用戶畫像,更主動甚至自動進行實時性的營銷和推廣,且保證逐步增長的精準性。
第三,不能做到對用戶的實時營銷。原本的核心系統(tǒng)在包括長事務的多個環(huán)節(jié),需要對許多信息進行判定、核實(比如額度是否透支、上期還款是否已到位)才能確保交易成功,沒法同時完成實時營銷。如果在核心系統(tǒng)之外另外開發(fā)一套數(shù)據(jù)系統(tǒng),導入新流入的用戶交易大數(shù)據(jù),那么就可以在核心系統(tǒng)之外做到數(shù)據(jù)的實時更新,既不影響核心系統(tǒng)的事務處理,又可以據(jù)實時更新的數(shù)據(jù),并以這些數(shù)據(jù)做在線實時分析,觸發(fā)事件式精準營銷。
甚至在未來,是否會有可能對用戶信用情況做評估上的調(diào)整,酌情降低或者提高透支額度?對于這個問題,梁晟的回答很堅定,“銀行卡業(yè)務最核心的就是信貸,并高度強調(diào)風控。分布式計算框架能整合多方數(shù)據(jù),使海量數(shù)據(jù)在線分析成為可能,與信用評估的結(jié)合是必然的”。
在上述第三點實時營銷方面,大數(shù)據(jù)的應用也分為細分的幾種應用場景:
浦發(fā)信用卡市場合作方每年有上萬家商戶。例如跟星巴克的有活動合約,刷信用卡,滿足一系列的規(guī)則條件可以 88 折,在某一些節(jié)假日可以買一送一,或者當日信用卡總消費金融滿 1000 元就可以買一送一,這些活動需要有一套完整的活動規(guī)則引擎去進行快速匹配,并發(fā)計算量非常大,還涉及到一些事務性處理,引入大數(shù)據(jù)的計算架構使得這些在線分析成為可能。
用戶信息更新需要較長的周期,例如積分,例如:刷卡滿了一定金額可以升級鉆石會員,但這樣的周期往往太長,難以滿足日益提升的用戶服務質(zhì)量要求,大數(shù)據(jù)服務平臺建立了用戶分析的模型,批量處理用戶積分,以及 “白領”、“吃貨”、“土豪” 等用戶畫像標簽,也,可以做到以周為單位更新數(shù)據(jù)?,F(xiàn)在用戶標簽是靜態(tài)標簽,近期還會擴展為動態(tài)標簽。
針對以上所述痛點,浦發(fā)銀行信用卡中心和天璣科技的聯(lián)袂主要從以下幾部戰(zhàn)略作為切入點:
第一,結(jié)合卡類業(yè)務實時營銷的系統(tǒng),浦發(fā)銀行信用卡中心專門成立了數(shù)據(jù)服務部,由天璣科技大數(shù)據(jù)團隊提供大數(shù)據(jù)服務平臺,包含了實時營銷功能,為將來所有的浦發(fā)信用卡中心業(yè)務部門和外部機構提供數(shù)據(jù)服務。數(shù)據(jù)必須要關聯(lián)才有價值,金融的數(shù)據(jù)是價值密度非常高、也最真實?;氐角懊鏀?shù)據(jù)量大、數(shù)據(jù)處理系統(tǒng)龐雜的痛點,數(shù)據(jù)服務部目前是與外部征信、政府、公安、電商等進行大數(shù)據(jù)對接的一個核心平臺,力圖在未來做到數(shù)據(jù)互聯(lián),形成本地完整的大數(shù)據(jù)小生態(tài)圈。
海量數(shù)據(jù)的存儲和分析處理、升級是一方面,另外一方面就是交易數(shù)據(jù)也同時以流式計算的方式進入大數(shù)據(jù)服務平臺,實時營銷模塊跟核心系統(tǒng)是分離的,大數(shù)據(jù)服務平臺與核心系統(tǒng)存在交互,為其它業(yè)務應用提供數(shù)據(jù)服務,通過 web-service 接口來大數(shù)據(jù)服務平臺的數(shù)據(jù)。
第二,作為數(shù)據(jù)服務的核心系統(tǒng)之一,必須要有明確的定位,將來業(yè)務拓展、落地的重任由數(shù)據(jù)服務部提供數(shù)據(jù)支持。結(jié)合以上大數(shù)據(jù)實時營銷的場景,相比于線上 DSP 廣告大多以具體商品作為用戶的興趣標簽,信用卡本身掌握更多的線下用戶數(shù)據(jù)、用戶刷卡地點。此外,天璣科技方提供的大數(shù)據(jù)服務目前還會結(jié)合消費數(shù)量、消費金額量等活動規(guī)則,實時進行規(guī)則引擎進行匹配,進行流式計算,完全的分布式高效處理數(shù)據(jù)。
未來業(yè)務拓展方面,還會結(jié)合商圈和 LBS 進行更精準的推薦和營銷,而這些業(yè)務要取得一定的外部數(shù)據(jù)源,大數(shù)據(jù)服務平臺為將來的業(yè)務營銷方案提供了基礎的應用計算框架。假設,未來跟大眾點評等有合作的話,就可以獲得更多實時的用戶、浦發(fā)信用卡合作商戶的地理位置信息,從數(shù)據(jù)庫里的全國幾十萬種活動中,挑選出 1-3 個最匹配的活動推送給單個用戶。
許多銀行都會利用大數(shù)據(jù)技術進行用戶畫像,或者歷史數(shù)據(jù)查詢,梁晟則認為,此次浦發(fā)信用卡中心是國內(nèi)傳統(tǒng)金融圈內(nèi)第一家做到大數(shù)據(jù)實時營銷的機構,“天璣科技的大數(shù)據(jù)團隊為浦發(fā)信用卡中心的市場部、電銷部、客服中心和移動金融部等部門的提供實時數(shù)據(jù)服務,可說是初步綜合形成大數(shù)據(jù)的生態(tài)圈。在傳統(tǒng)銀行向互聯(lián)網(wǎng) + 大數(shù)據(jù)嘗試的方向上踏出了堅實的一步”。未來,大數(shù)據(jù)應用在傳統(tǒng)銀行業(yè)又會創(chuàng)造怎樣的成績?
的確,許多大數(shù)據(jù)的應用場景還沒有真正做到實際落地,大多傳統(tǒng)銀行機構還在觀望,小試牛刀的互聯(lián)網(wǎng)企業(yè)似乎停駐在支付寶的 “花唄” 等線上層面的嘗試。數(shù)據(jù)來源則更顯得缺失,大數(shù)據(jù)更多的是通過線上數(shù)據(jù)共享獲得,較為經(jīng)典的應用實例就是淘寶的運費險了。運費險做過一套大數(shù)據(jù)智慧應用的解決方案,退貨發(fā)生的概率,跟買家、賣家的習慣、商品的品種、價值、促銷活動等都有一定相關度。運費險采用了第三方提供的解決方案,應用數(shù)據(jù)挖掘的方法,建立退貨發(fā)生的概率模型植入系統(tǒng),就可以在每一筆交易發(fā)生的時候,給出不同的保險費率,使保險費的收取,使之與退貨發(fā)生的概率相匹配。
問題是,真正將線下消費的數(shù)據(jù)沉淀付諸大數(shù)據(jù)應用的例子實在太少,國外的案例是 Target,而在國內(nèi)呢?
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓練與驗證損失驟升:機器學習訓練中的異常診斷與解決方案 在機器學習模型訓練過程中,“損失曲線” 是反映模型學習狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構數(shù)據(jù)價值的核心操盤手 表格結(jié)構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11