
大數(shù)據(jù)在京東的典型應用:京東用戶畫像技術曝光
一方面是海量信息的匯集,京東是一家大型全品類綜合電商,海量商品和消費者產生了從網(wǎng)站前端瀏覽、搜索、評價、交易到網(wǎng)站后端支付、收貨、客服等多維度全覆蓋的數(shù)據(jù)體系,另一方面日益復雜的業(yè)務場景和邏輯使得信息的處理挖掘日益重要;也就是說,京東已經(jīng)形成一個儲量豐富、品位上乘且增量巨大的數(shù)據(jù)金礦,但是在相當長一段時間,很多業(yè)務童鞋經(jīng)常面對寶山空回的局面,比如我們的數(shù)據(jù)“瘋析獅”和“攻城獅”被業(yè)務童鞋反復追問,為什么我的促銷活動做了這么久,力度也挺大,就是沒有帶來預期用戶的增長呢?從用戶畫像分析來看,很可能是在錯誤的時間錯誤的地點對錯誤的人做了錯誤的促銷活動。
用戶畫像就是在解決把數(shù)據(jù)轉化為商業(yè)價值的問題,就是從海量數(shù)據(jù)中來挖金煉銀。這些以TB計的高質量多維數(shù)據(jù)記錄著用戶長期大量的網(wǎng)絡行為,用戶畫像據(jù)此來還原用戶的屬性特征、社會背景、興趣喜好,甚至還能揭示內心需求、性格特點、社交人群等潛在屬性。了解了用戶各種消費行為和需求,精準刻畫人群特征,并針對特定業(yè)務場景進行用戶特征不同維度的聚合,就可以把原本冷冰冰的數(shù)據(jù)復原成栩栩如生的用戶形象,從而指導和驅動業(yè)務場景和運營,發(fā)現(xiàn)和把握蘊藏在細分海量用戶中的巨大商機。
從邏輯上說,是從具體的業(yè)務場景出發(fā),結合數(shù)據(jù)表現(xiàn),歸納學習出基準的規(guī)則或方法,然后通過反復迭代的學習過程,生成符合既定約束條件的最優(yōu)化方案,然后把此方案泛化推廣到類似的場景中去。很多時候用戶畫像都是從一個具體品類的業(yè)務場景或需求出發(fā),有一些業(yè)務童鞋運營經(jīng)驗很豐富,結合對他們經(jīng)驗和需求的訪談,攻城獅會把業(yè)務語言抽象出來,結合數(shù)據(jù)語言轉化成通用的技術語言,然后用他們神奇的大腦和給力的大數(shù)據(jù)平臺生產出符合需求預期的結果,經(jīng)過業(yè)務童鞋反復驗證有效后,這個畫像就宣告成功,然后,攻城獅童鞋會再次驅動其神奇的大腦,將此畫像推廣到京東全站應用中去,這種從群眾中來到群眾中去的方法由于其敏捷高效快速迭代的優(yōu)點,產生了一大批性能優(yōu)良的產品。
當然,對于一些對用戶畫像基本屬性,由于其對所有品類或場景的通用型較強,攻城獅會跳過單品類測試,直接針對全站用戶建模,效果也非常好。
用戶畫像應用服務支持京東集團全業(yè)務需求,其下游面向不同類型不同需求的人群,他們需求各不相同,從技術方案到使用方法也千差萬別,因此有必要采取體系化多層次服務平臺進行支持。對于公司內部,針對研發(fā)、采銷、市場、客服、物流等各體系不同需求分別采取統(tǒng)一數(shù)據(jù)倉庫、數(shù)據(jù)接口服務、產品化平臺多種服務方式提供支持,針對各業(yè)務線需求場景不同,人員經(jīng)驗也不盡相同,用戶畫像的平臺化給內部使用人員打造切合自身業(yè)務場景和使用經(jīng)驗的操作:對經(jīng)驗豐富的使用者提供更深入、綜合參考并可自主訂制或二次開發(fā);給經(jīng)驗較淺的用戶提供數(shù)據(jù)之外還培養(yǎng)其分析意識;對小白用戶則可建立數(shù)據(jù)化分析運營的意識與習慣;對外部用戶的支持力度也在逐步放開、加大,比如POP商家,可以滿足商家針對自身店鋪的個性化訂制需求,并結合各種營銷方式提供一站式服務解決方案。
在京東用戶行為日志中,每天記錄著數(shù)以億計的用戶來訪及海量行為。我們通過對用戶行為數(shù)據(jù)進行分析和挖掘,發(fā)掘用戶的偏好,逐步勾勒出用戶的畫像。用戶畫像通常通過業(yè)務經(jīng)驗和建立模型相結合的方法來實現(xiàn),但有主次之分,有些畫像更偏重于業(yè)務經(jīng)驗的判斷,有些畫像更偏重于建立模型。
業(yè)務經(jīng)驗結合大數(shù)據(jù)分析為主勾畫的人群,此類畫像由于跟業(yè)務緊密相關,更多的是通過業(yè)務人員提供的經(jīng)驗來描述用戶偏好。舉個例子,比如:根據(jù)業(yè)務人員的經(jīng)驗,基于客戶對金額、利潤、信用等方面的貢獻,建立多層綜合指標體系,從而對用戶的價值進行分級,生成用戶價值的畫像。一方面我們的產品經(jīng)理可以根據(jù)用戶價值的不同采取針對性的營銷策略,另一方面通過分析我們的不同價值等級用戶的占比,從而思考如何將低價值的用戶發(fā)展成高價值的用戶。
再比如,通過用戶在下單前的瀏覽情況,業(yè)務人員可以區(qū)分用戶的購物性格。有些用戶總是在短時間內比較了少量的商品就下單,那么他的購物性格便是沖動型;有些用戶總是在反復不停的比較少量同類商品最后才下單,那么他的購物性格便是理性型;有些用戶總是長時間大量的瀏覽了很多商品最后才下單,那么他的購物性格便是猶豫型。對于不同購物性格的用戶,我們可以推薦不同類型的商品,針對沖動型用戶,我們直接推薦給他/她最暢銷的同類商品,而理性型用戶我們推薦給他/她口碑最好的商品。并且針對每一個用戶,我們根據(jù)其購物性格定制了個性化的營銷手段。
以建立模型為主勾畫的人群,我們不能認為買過母嬰類用品的用戶家里就一定有小孩,因為這次購買很有可能是替別人代買或者送禮物。所以我們要判斷這個用戶所購買的母嬰類商品是否是給自己買。根據(jù)用戶下單前瀏覽情況、收貨地址、對商品的評價等多種信息建立模型,最終判斷出用戶家庭是否有小孩。再根據(jù)購買的商品標簽,比如奶粉的段數(shù),童書適應年齡段等信息,建立孩子成長模型,在孩子所處不同的階段進行精準營銷。
京東擁有最全的品類,各品類間用戶轉化成為我們業(yè)務的一個重點。挖掘一個品類的潛在用戶,首先要找出此品類已有的用戶,然后通過這些用戶的行為、偏好、畫像等信息對用戶細分,挖掘其獨有的特征,最后通過這些特征建立模型定位出該品類的潛在用戶。
這一階段主要是為了驗證我們?yōu)橛脩裘枥L的畫像是否準確。比如一個用戶的畫像是:性別男、年齡在36歲~45歲之間、家里有小孩、未婚、有車一族、購買等級高。我們可以很快發(fā)現(xiàn)家里有小孩且未婚這一矛盾的結果。首先,我們可以判斷對這個用戶的畫像肯定有問題的。接下來我們看這個用戶的畫像,似乎只有未婚這一條與其他畫像格格不入。通過模型之間的驗證,我們發(fā)現(xiàn)一些錯誤案例并分析原因,進而改進我們的模型。
明嘉靖朝著名內閣首輔徐階主政后,在其工位上有個著名條幅,其著名水平堪與東哥在蘇州街墻上“戰(zhàn)斗!戰(zhàn)斗!只爭第一”相媲美,他寫的是“以威福還主上 以政務還諸司 以用舍刑賞還諸公論”,我的理解,就是各司其職,各展其長,用戶畫像的服務也是針對各服務對象進行區(qū)別對待,方便用戶使用,具體實現(xiàn)方法是:JDW+CUBE+BMP。
首先,對用戶畫像的結果進行標準化加工,同步至企業(yè)統(tǒng)一的JDW平臺,解決數(shù)據(jù)孤島,方便研發(fā)底層調用;同時,按主題建立多維分析的數(shù)據(jù)CUBE,直接面向瘋析獅和攻城獅;另外,還進一步打通上下游關聯(lián)數(shù)據(jù)和產品,尤其是大營銷平臺(BMP),這個主要針對產品經(jīng)理和一線采銷人員,他們可以在CUBE篩選出預定人群后直接調用營銷平臺進行發(fā)券、EDM等操作,減少了諸多中間環(huán)節(jié),實現(xiàn)高效運營和精準營銷,大大提升人效。其中,多維分析CUBE是用戶畫像產品化的出色應用之一,其用戶畫像的諸多維度和訂單、商品、流量等指標的組合可以快速實現(xiàn)智能分析,并可根據(jù)數(shù)據(jù)對比分析提供專業(yè)有效的建議,將數(shù)據(jù)轉化成知識和決策供大家使用。
用戶畫像提供統(tǒng)一數(shù)據(jù)服務接口供網(wǎng)站其他產品調用,提高與用戶間的溝通效率、提升用戶體驗。比如提供給推薦搜索調用,針對不同用戶屬性特征、性格特點或行為習慣在他搜索或點擊時展示符合該用戶特點和偏好的商品,給用戶以友好舒適的購買體驗,能很大程度上提高用戶的購買轉化率甚至重復購買,對提高用戶忠誠度和用戶粘性有很大幫助;比如數(shù)據(jù)接口提供給網(wǎng)站智能機器人JIMI,可以基于用戶畫像的用戶量身定做咨詢應答策略,比如快速理解用戶意圖、針對性商品評測或商品推薦、個性化關懷等,大幅提升JIMI智能水平和服務力度,贏得用戶歡迎和肯定。
今年618前夕京東范產品的數(shù)據(jù)接口服務,將用戶畫像模型充分應用到產品當中,根據(jù)族群的差異化特征,幫助業(yè)務部門找到營銷機會、運營方向,全面提高產品的核心影響力,增強產品用戶體驗。應用模型包括:年齡、性格、購物偏好、購買力等用戶特征,詮釋勾勒出用戶在京東上的體貌特征,賦予一定的潮流“范兒”的概念,貼近用戶。
京東數(shù)聚匯也是用戶畫像的一個典型應用,通過深度分析年度網(wǎng)購用戶的行為,挖掘網(wǎng)絡購物趣味數(shù)據(jù),結合用戶畫像,從用戶的購物行為入手,結合年度流行熱點,分析不同地域網(wǎng)購人群的購物習慣和喜好,為網(wǎng)民展現(xiàn)一場京東大數(shù)據(jù)的饕餮盛宴,同時給商家和消費者提供了經(jīng)營和購物參考。
CDA數(shù)據(jù)分析師培訓官網(wǎng)
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03