
大數(shù)據(jù)在京東的典型應(yīng)用:京東用戶畫像技術(shù)曝光
一方面是海量信息的匯集,京東是一家大型全品類綜合電商,海量商品和消費(fèi)者產(chǎn)生了從網(wǎng)站前端瀏覽、搜索、評價、交易到網(wǎng)站后端支付、收貨、客服等多維度全覆蓋的數(shù)據(jù)體系,另一方面日益復(fù)雜的業(yè)務(wù)場景和邏輯使得信息的處理挖掘日益重要;也就是說,京東已經(jīng)形成一個儲量豐富、品位上乘且增量巨大的數(shù)據(jù)金礦,但是在相當(dāng)長一段時間,很多業(yè)務(wù)童鞋經(jīng)常面對寶山空回的局面,比如我們的數(shù)據(jù)“瘋析獅”和“攻城獅”被業(yè)務(wù)童鞋反復(fù)追問,為什么我的促銷活動做了這么久,力度也挺大,就是沒有帶來預(yù)期用戶的增長呢?從用戶畫像分析來看,很可能是在錯誤的時間錯誤的地點(diǎn)對錯誤的人做了錯誤的促銷活動。
用戶畫像就是在解決把數(shù)據(jù)轉(zhuǎn)化為商業(yè)價值的問題,就是從海量數(shù)據(jù)中來挖金煉銀。這些以TB計(jì)的高質(zhì)量多維數(shù)據(jù)記錄著用戶長期大量的網(wǎng)絡(luò)行為,用戶畫像據(jù)此來還原用戶的屬性特征、社會背景、興趣喜好,甚至還能揭示內(nèi)心需求、性格特點(diǎn)、社交人群等潛在屬性。了解了用戶各種消費(fèi)行為和需求,精準(zhǔn)刻畫人群特征,并針對特定業(yè)務(wù)場景進(jìn)行用戶特征不同維度的聚合,就可以把原本冷冰冰的數(shù)據(jù)復(fù)原成栩栩如生的用戶形象,從而指導(dǎo)和驅(qū)動業(yè)務(wù)場景和運(yùn)營,發(fā)現(xiàn)和把握蘊(yùn)藏在細(xì)分海量用戶中的巨大商機(jī)。
從邏輯上說,是從具體的業(yè)務(wù)場景出發(fā),結(jié)合數(shù)據(jù)表現(xiàn),歸納學(xué)習(xí)出基準(zhǔn)的規(guī)則或方法,然后通過反復(fù)迭代的學(xué)習(xí)過程,生成符合既定約束條件的最優(yōu)化方案,然后把此方案泛化推廣到類似的場景中去。很多時候用戶畫像都是從一個具體品類的業(yè)務(wù)場景或需求出發(fā),有一些業(yè)務(wù)童鞋運(yùn)營經(jīng)驗(yàn)很豐富,結(jié)合對他們經(jīng)驗(yàn)和需求的訪談,攻城獅會把業(yè)務(wù)語言抽象出來,結(jié)合數(shù)據(jù)語言轉(zhuǎn)化成通用的技術(shù)語言,然后用他們神奇的大腦和給力的大數(shù)據(jù)平臺生產(chǎn)出符合需求預(yù)期的結(jié)果,經(jīng)過業(yè)務(wù)童鞋反復(fù)驗(yàn)證有效后,這個畫像就宣告成功,然后,攻城獅童鞋會再次驅(qū)動其神奇的大腦,將此畫像推廣到京東全站應(yīng)用中去,這種從群眾中來到群眾中去的方法由于其敏捷高效快速迭代的優(yōu)點(diǎn),產(chǎn)生了一大批性能優(yōu)良的產(chǎn)品。
當(dāng)然,對于一些對用戶畫像基本屬性,由于其對所有品類或場景的通用型較強(qiáng),攻城獅會跳過單品類測試,直接針對全站用戶建模,效果也非常好。
用戶畫像應(yīng)用服務(wù)支持京東集團(tuán)全業(yè)務(wù)需求,其下游面向不同類型不同需求的人群,他們需求各不相同,從技術(shù)方案到使用方法也千差萬別,因此有必要采取體系化多層次服務(wù)平臺進(jìn)行支持。對于公司內(nèi)部,針對研發(fā)、采銷、市場、客服、物流等各體系不同需求分別采取統(tǒng)一數(shù)據(jù)倉庫、數(shù)據(jù)接口服務(wù)、產(chǎn)品化平臺多種服務(wù)方式提供支持,針對各業(yè)務(wù)線需求場景不同,人員經(jīng)驗(yàn)也不盡相同,用戶畫像的平臺化給內(nèi)部使用人員打造切合自身業(yè)務(wù)場景和使用經(jīng)驗(yàn)的操作:對經(jīng)驗(yàn)豐富的使用者提供更深入、綜合參考并可自主訂制或二次開發(fā);給經(jīng)驗(yàn)較淺的用戶提供數(shù)據(jù)之外還培養(yǎng)其分析意識;對小白用戶則可建立數(shù)據(jù)化分析運(yùn)營的意識與習(xí)慣;對外部用戶的支持力度也在逐步放開、加大,比如POP商家,可以滿足商家針對自身店鋪的個性化訂制需求,并結(jié)合各種營銷方式提供一站式服務(wù)解決方案。
在京東用戶行為日志中,每天記錄著數(shù)以億計(jì)的用戶來訪及海量行為。我們通過對用戶行為數(shù)據(jù)進(jìn)行分析和挖掘,發(fā)掘用戶的偏好,逐步勾勒出用戶的畫像。用戶畫像通常通過業(yè)務(wù)經(jīng)驗(yàn)和建立模型相結(jié)合的方法來實(shí)現(xiàn),但有主次之分,有些畫像更偏重于業(yè)務(wù)經(jīng)驗(yàn)的判斷,有些畫像更偏重于建立模型。
業(yè)務(wù)經(jīng)驗(yàn)結(jié)合大數(shù)據(jù)分析為主勾畫的人群,此類畫像由于跟業(yè)務(wù)緊密相關(guān),更多的是通過業(yè)務(wù)人員提供的經(jīng)驗(yàn)來描述用戶偏好。舉個例子,比如:根據(jù)業(yè)務(wù)人員的經(jīng)驗(yàn),基于客戶對金額、利潤、信用等方面的貢獻(xiàn),建立多層綜合指標(biāo)體系,從而對用戶的價值進(jìn)行分級,生成用戶價值的畫像。一方面我們的產(chǎn)品經(jīng)理可以根據(jù)用戶價值的不同采取針對性的營銷策略,另一方面通過分析我們的不同價值等級用戶的占比,從而思考如何將低價值的用戶發(fā)展成高價值的用戶。
再比如,通過用戶在下單前的瀏覽情況,業(yè)務(wù)人員可以區(qū)分用戶的購物性格。有些用戶總是在短時間內(nèi)比較了少量的商品就下單,那么他的購物性格便是沖動型;有些用戶總是在反復(fù)不停的比較少量同類商品最后才下單,那么他的購物性格便是理性型;有些用戶總是長時間大量的瀏覽了很多商品最后才下單,那么他的購物性格便是猶豫型。對于不同購物性格的用戶,我們可以推薦不同類型的商品,針對沖動型用戶,我們直接推薦給他/她最暢銷的同類商品,而理性型用戶我們推薦給他/她口碑最好的商品。并且針對每一個用戶,我們根據(jù)其購物性格定制了個性化的營銷手段。
以建立模型為主勾畫的人群,我們不能認(rèn)為買過母嬰類用品的用戶家里就一定有小孩,因?yàn)檫@次購買很有可能是替別人代買或者送禮物。所以我們要判斷這個用戶所購買的母嬰類商品是否是給自己買。根據(jù)用戶下單前瀏覽情況、收貨地址、對商品的評價等多種信息建立模型,最終判斷出用戶家庭是否有小孩。再根據(jù)購買的商品標(biāo)簽,比如奶粉的段數(shù),童書適應(yīng)年齡段等信息,建立孩子成長模型,在孩子所處不同的階段進(jìn)行精準(zhǔn)營銷。
京東擁有最全的品類,各品類間用戶轉(zhuǎn)化成為我們業(yè)務(wù)的一個重點(diǎn)。挖掘一個品類的潛在用戶,首先要找出此品類已有的用戶,然后通過這些用戶的行為、偏好、畫像等信息對用戶細(xì)分,挖掘其獨(dú)有的特征,最后通過這些特征建立模型定位出該品類的潛在用戶。
這一階段主要是為了驗(yàn)證我們?yōu)橛脩裘枥L的畫像是否準(zhǔn)確。比如一個用戶的畫像是:性別男、年齡在36歲~45歲之間、家里有小孩、未婚、有車一族、購買等級高。我們可以很快發(fā)現(xiàn)家里有小孩且未婚這一矛盾的結(jié)果。首先,我們可以判斷對這個用戶的畫像肯定有問題的。接下來我們看這個用戶的畫像,似乎只有未婚這一條與其他畫像格格不入。通過模型之間的驗(yàn)證,我們發(fā)現(xiàn)一些錯誤案例并分析原因,進(jìn)而改進(jìn)我們的模型。
明嘉靖朝著名內(nèi)閣首輔徐階主政后,在其工位上有個著名條幅,其著名水平堪與東哥在蘇州街墻上“戰(zhàn)斗!戰(zhàn)斗!只爭第一”相媲美,他寫的是“以威福還主上 以政務(wù)還諸司 以用舍刑賞還諸公論”,我的理解,就是各司其職,各展其長,用戶畫像的服務(wù)也是針對各服務(wù)對象進(jìn)行區(qū)別對待,方便用戶使用,具體實(shí)現(xiàn)方法是:JDW+CUBE+BMP。
首先,對用戶畫像的結(jié)果進(jìn)行標(biāo)準(zhǔn)化加工,同步至企業(yè)統(tǒng)一的JDW平臺,解決數(shù)據(jù)孤島,方便研發(fā)底層調(diào)用;同時,按主題建立多維分析的數(shù)據(jù)CUBE,直接面向瘋析獅和攻城獅;另外,還進(jìn)一步打通上下游關(guān)聯(lián)數(shù)據(jù)和產(chǎn)品,尤其是大營銷平臺(BMP),這個主要針對產(chǎn)品經(jīng)理和一線采銷人員,他們可以在CUBE篩選出預(yù)定人群后直接調(diào)用營銷平臺進(jìn)行發(fā)券、EDM等操作,減少了諸多中間環(huán)節(jié),實(shí)現(xiàn)高效運(yùn)營和精準(zhǔn)營銷,大大提升人效。其中,多維分析CUBE是用戶畫像產(chǎn)品化的出色應(yīng)用之一,其用戶畫像的諸多維度和訂單、商品、流量等指標(biāo)的組合可以快速實(shí)現(xiàn)智能分析,并可根據(jù)數(shù)據(jù)對比分析提供專業(yè)有效的建議,將數(shù)據(jù)轉(zhuǎn)化成知識和決策供大家使用。
用戶畫像提供統(tǒng)一數(shù)據(jù)服務(wù)接口供網(wǎng)站其他產(chǎn)品調(diào)用,提高與用戶間的溝通效率、提升用戶體驗(yàn)。比如提供給推薦搜索調(diào)用,針對不同用戶屬性特征、性格特點(diǎn)或行為習(xí)慣在他搜索或點(diǎn)擊時展示符合該用戶特點(diǎn)和偏好的商品,給用戶以友好舒適的購買體驗(yàn),能很大程度上提高用戶的購買轉(zhuǎn)化率甚至重復(fù)購買,對提高用戶忠誠度和用戶粘性有很大幫助;比如數(shù)據(jù)接口提供給網(wǎng)站智能機(jī)器人JIMI,可以基于用戶畫像的用戶量身定做咨詢應(yīng)答策略,比如快速理解用戶意圖、針對性商品評測或商品推薦、個性化關(guān)懷等,大幅提升JIMI智能水平和服務(wù)力度,贏得用戶歡迎和肯定。
今年618前夕京東范產(chǎn)品的數(shù)據(jù)接口服務(wù),將用戶畫像模型充分應(yīng)用到產(chǎn)品當(dāng)中,根據(jù)族群的差異化特征,幫助業(yè)務(wù)部門找到營銷機(jī)會、運(yùn)營方向,全面提高產(chǎn)品的核心影響力,增強(qiáng)產(chǎn)品用戶體驗(yàn)。應(yīng)用模型包括:年齡、性格、購物偏好、購買力等用戶特征,詮釋勾勒出用戶在京東上的體貌特征,賦予一定的潮流“范兒”的概念,貼近用戶。
京東數(shù)聚匯也是用戶畫像的一個典型應(yīng)用,通過深度分析年度網(wǎng)購用戶的行為,挖掘網(wǎng)絡(luò)購物趣味數(shù)據(jù),結(jié)合用戶畫像,從用戶的購物行為入手,結(jié)合年度流行熱點(diǎn),分析不同地域網(wǎng)購人群的購物習(xí)慣和喜好,為網(wǎng)民展現(xiàn)一場京東大數(shù)據(jù)的饕餮盛宴,同時給商家和消費(fèi)者提供了經(jīng)營和購物參考。
CDA數(shù)據(jù)分析師培訓(xùn)官網(wǎng)
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10