
淘寶網(wǎng),是全球最受歡迎的網(wǎng)購零售平臺之一,擁有近5億的注冊用戶數(shù),每天有超過6千萬的固定訪客,同時每天的在線商品數(shù)已經(jīng)超過了8億件,平均每分鐘售出4.8萬件商品。
作為電商行業(yè)的標桿,淘寶網(wǎng)的用戶行為數(shù)據(jù),一定程度上反映了用戶的購買行為規(guī)律。本項目利用MySQL對淘寶用戶行為數(shù)據(jù)進行分析,探索不同用戶的消費習慣,結合店鋪營銷策略,以實現(xiàn)精準化運營,減少運營成本,增加店鋪營收。
探索目標:每日不同時段流量走勢,質(zhì)量如何?用戶行為轉化情況怎樣?如何提高留存、增加復購?如
何判斷高價值用戶,針對不同用戶如何進行個性化營銷?
分析思路:
1.數(shù)據(jù)獲取
數(shù)據(jù)集來源于淘寶APP移動端,2014年11月18日至2014年12月18日的用戶行為數(shù)據(jù)。
2.數(shù)據(jù)理解
表中有7個字段:用戶ID、商品ID、商品類目ID、用戶行為類型、用戶所在地理位置、用戶行為時間、金額,一共有12256905條數(shù)據(jù)。限于電腦性能,僅提取前1048575條記錄用作分析。
3.1建表導數(shù):
create database taobao;
use taobao;
create table UserBehavior(
user_id int,
item_id int,
item_category int,
behavior_type varchar(10),
user_geohash varchar(10),
times datetime,
amount decimal(5,2)
);
load data infile "C:/ProgramData/MySQL/MySQL Server
8.0/Uploads/UserBehavior.csv"
into table UserBehavior
fields terminated by ','
ignore 1 lines;
3.2缺失值處理:
查詢結果中發(fā)現(xiàn)user_geohash字段存在缺失值,缺失比例超過50%。缺失嚴重的數(shù)據(jù)在后續(xù)分析中意義不大,可做刪除處理。
3.3異常值檢查
檢查發(fā)現(xiàn)該數(shù)據(jù)集中不存在異常值。
3.4重復記錄處理
該數(shù)據(jù)集有86478條重復記錄,篩選不重復的記錄共962097行。
3.5字段處理:
根據(jù)times字段增加計算字段用戶行為日期、周和小時,排除后續(xù)分析不需要的user_geohash字段,并將篩選后的結果保存到新表。
清洗后的數(shù)據(jù)集共962097條記錄,展示了2014-11-18至2014-12-18這一個月內(nèi),8477位用戶對7095個類目下701609個商品產(chǎn)生的902050次點擊,29016次加購,20930次收藏,10101次購買行為。
1.流量指標分析
查詢結果中發(fā)現(xiàn)瀏覽量PV、訪客量UV和人均瀏覽量的總體變化趨勢是相同的。11月18-29日,PV在25000-28000之間,UV在5800-6200之間,人均瀏覽量在4.1-4.6之間,成交量在260-320之間,銷售額在20000-28000之間;11月30日-12月10日,PV在27000-31000之間,UV在6000-6400之間,人均瀏覽量在4.4-4.9之間,成交量在280-370之間,銷售額在22000-30000之間;12月11日、12日因雙12的緣故,PV分別達到了35851、51034,UV分別為6576、7049,人均瀏覽量分別為5.5、7.2,成交量分別為409、569,銷售額分別為32022.71、46100.93;而在雙12之后,PV也穩(wěn)定在28000-30000之間,UV在6000-6200之間,人均瀏覽量在4.6-4.8之間,成交量在280-340之間,銷售額在22000-28000之間,遠遠優(yōu)于11月29日之前的數(shù)據(jù),說明雙12的營銷活動對用戶行為有顯著影響。
同時,在11月21、28日,12月5日,瀏覽量PV、訪客量UV、人均瀏覽量、成交量和銷售額都出現(xiàn)了不同程度的下滑。細查發(fā)現(xiàn)以上三天都是周五,觀察流量的周期性變化中發(fā)現(xiàn),每周二到周四數(shù)據(jù)比較穩(wěn)定,周五到周一會出現(xiàn)小幅度下滑,這跟大部分用戶的工作和生活習慣息息相關。
從每天的時間段來看,21點和22點是用戶活躍的高峰時間,人均瀏覽量在10次以上,22點之后一路下降,一直到凌晨4點降到最低值,4點到10點漸漸回溫,10點到18點基本穩(wěn)定,18點之后開始一路攀升,商家可以集中資源,在用戶活躍度較高的時間段采取一些引流手段。
2.行為轉化分析
瀏覽人數(shù):點擊產(chǎn)品詳情頁的用戶數(shù)
收藏人數(shù):收藏產(chǎn)品產(chǎn)品詳情頁的用戶數(shù)
加購人數(shù):將產(chǎn)品添加到購物車的用戶數(shù)
購買人數(shù):下單的用戶數(shù)
在所有用戶行為數(shù)據(jù)中瀏覽產(chǎn)品詳情頁后產(chǎn)生購買行為的用戶只有4330人,占瀏覽用戶的51%,也就是說,還有49%的用戶行為是沒有轉化為成交的,用戶在瀏覽商品詳情頁后出現(xiàn)了大量的流失。那么從瀏覽到購買,每個環(huán)節(jié)的轉化率是多少?用戶主要是在哪個環(huán)節(jié)流失的呢?
對比發(fā)現(xiàn),從瀏覽到收藏的轉化率僅為38.73%,而瀏覽到加購的轉化率為61.41%。因為收藏和加購行為之間并沒有直接的先后關系,且加入收藏后并沒有可以下單的入口,如果需要購買必須重新點擊商品進入詳情頁才能下單,所以用戶更愿意將感興趣或有購買意向的商品添加到購物車。
在瀏覽-加購-購買的購物行為路徑中,加購轉化率為61.41%,購買轉化率為83.21%,也就是說大部分的用戶更偏向于將商品添加到購物車后下單,可能是為了湊單參加滿減優(yōu)惠。
分析每天瀏覽-加購-購買的轉化率情況發(fā)現(xiàn),瀏覽-加購的轉化率變化并不明顯,雙十二之前穩(wěn)定在10%-13%之間,僅在雙十二當天達到17.26%,且在雙十二之后轉化率明顯下降。而加購-購買的轉化率波動較大,在感恩節(jié)、服飾煥新和雙十二活動前后分別達到了45.48%、44.21%、42.81%,而雙十二之后的數(shù)據(jù)表現(xiàn)也明顯優(yōu)于雙十二之前,說明部分商品在雙十二之后依然有返場活動,促進用戶消費。
3.消費偏好分析
根據(jù)二八法則即20%的產(chǎn)品貢獻了80%的銷售額甚至更多,將產(chǎn)品的貢獻定量分析,哪些類目的商品貢獻了多少的消費額。
在2066個商品類目中,銷售額排名前623個類目貢獻了646009.09的銷售額,可集中人力和財力優(yōu)化這些類目的商品及渠道。
4.用戶價值分析
通過對用戶價值的細分,進行差異化的精細運營,從而提升運營效率和用戶體驗。RFM模型是衡量客戶價值和客戶創(chuàng)利能力的重要工具,通過客戶的消費時間間隔(Recency)、消費頻率(Frequency)以及消費金額(Monetary)三項指標來描述客戶的價值狀況。
-- 查詢每個用戶消費時間間隔、消費頻次、消費金額
+-----------+--------------+----------+----------+----------+
| user_id | 最近消費時間 | 間隔天數(shù) | 購買次數(shù) | 消費金額 |
+-----------+--------------+----------+----------+----------+
| 101260672 | 2014-11-20 | 29 | 1 | 72.55 |
| 116730636 | 2014-12-18 | 1 | 4 | 372.04 |
| 104811265 | 2014-12-09 | 10 | 1 | 120.71 |
| 106230218 | 2014-12-16 | 3 | 3 | 132.73 |
| 100684618 | 2014-12-12 | 7 | 3 | 203.67 |
| 103802946 | 2014-12-18 | 1 | 2 | 139.38 |
| 103891828 | 2014-12-15 | 4 | 6 | 496.24 |
| 116678892 | 2014-11-23 | 26 | 1 | 129.20 |
| 106557109 | 2014-11-22 | 27 | 1 | 38.06 |
| 104221274 | 2014-11-30 | 19 | 2 | 138.21 |
+-----------+--------------+----------+----------+----------+
-- RFM評分
+-----------+-------+-------+-------+
| user_id | R評分 | F評分 | M評分 |
+-----------+-------+-------+-------+
| 101260672 | 1 | 1 | 1 |
| 116730636 | 5 | 4 | 4 |
| 104811265 | 4 | 1 | 2 |
| 106230218 | 5 | 3 | 2 |
| 100684618 | 4 | 3 | 3 |
| 103802946 | 5 | 2 | 2 |
| 103891828 | 5 | 5 | 5 |
| 116678892 | 1 | 1 | 2 |
| 106557109 | 1 | 1 | 1 |
| 104221274 | 2 | 2 | 2 |
+-----------+-------+-------+-------+
-- RFM均值
+------------+------------+------------+
| avg(R評分) | avg(F評分) | avg(M評分) |
+------------+------------+------------+
| 3.5984 | 2.1039 | 2.2051 |
+------------+------------+------------+
-- RFM用戶價值
+-----------+-------+-------+-------+-------+-------+------+------------+
| user_id | R評分 | F評分 | M評分 | R程度 | F程度 | M程度 | 用戶價值 |
+-----------+-------+-------+-------+-------+-------+------+------------+
| 101260672 | 1 | 1 | 1 | 低 | 低 | 低 | 一般挽留用戶 |
| 116730636 | 5 | 4 | 4 | 高 | 高 | 高 | 重要價值用戶 |
| 104811265 | 4 | 1 | 2 | 高 | 低 | 低 | 一般發(fā)展用戶 |
| 106230218 | 5 | 3 | 2 | 高 | 高 | 低 | 一般價值用戶 |
| 100684618 | 4 | 3 | 3 | 高 | 高 | 高 | 重要價值用戶 |
| 103802946 | 5 | 2 | 2 | 高 | 低 | 低 | 一般發(fā)展用戶 |
| 103891828 | 5 | 5 | 5 | 高 | 高 | 高 | 重要價值用戶 |
| 116678892 | 1 | 1 | 2 | 低 | 低 | 低 | 一般挽留用戶 |
| 106557109 | 1 | 1 | 1 | 低 | 低 | 低 | 一般挽留用戶 |
| 104221274 | 2 | 2 | 2 | 低 | 低 | 低 | 一般挽留用戶 |
+-----------+-------+-------+-------+-------+-------+------+------------+
對用戶進行價值分層后,針對不同價值類型的用戶實行不同的營銷策略。
一般挽留用戶占比34.36%,占比最高,其交易時間間隔長,交易頻率低,消費金額低,存在流失風險,可以及時與用戶取得聯(lián)系,明確流失原因或了解用戶需求,想辦法挽回用戶。
一般發(fā)展用戶占比31.29%,占比排名第二,其交易時間間隔短,但消費頻率和消費金額都很低,可以利用推薦系統(tǒng)推薦其平時瀏覽的同類商品,或與此類客戶有相同購買屬性人群購買的商品,發(fā)送滿減優(yōu)惠券等,避免用戶流失。
重要價值客戶占比23.86%,其交易時間間隔短,消費頻率高,消費金額高,應加強交流與互動,深入了解用戶需求,提供個性化服務,增加用戶粘性??梢詫υ擃愑脩籼峁¬IP服務機制,提升用戶體驗與忠誠度。
根據(jù)流量數(shù)據(jù)指標分析,每天的18-22時是用戶活躍高峰期,可集中資源在該時間段進行引流與營銷活動,如推送爆款及暢銷商品,同時發(fā)送商家折扣優(yōu)惠、直播帶貨及促銷活動消息,提高商品購買率。
從用戶行為轉化漏斗分析,瀏覽到加購的轉化率遠遠高于瀏覽到收藏的轉化率,且加購到購買的轉化率高達83.21%。交易流程越多,用戶流失的可能性就越大,瞬間購買欲望的涌現(xiàn),往往時效性較短,每多一步流程,就多一份流失率。所以刪除不必要的跳轉界面,讓交易的完成時間更短,不要給用戶過多的猶豫時間。例如優(yōu)惠券的選擇,還需要繁瑣的領取步驟,滿足優(yōu)惠條件默認領取相應最大的優(yōu)惠,并在最后付款界面突出優(yōu)惠券帶來的滿減信息,促使用戶的成交花費時間更短。關于購物車,可以增加一個清理機制,比如加入購物車以后多少天不成交就清除,每隔一段時間就提醒用戶購物車內(nèi)還有什么商品未下單,什么時間商品將被清除。收藏和購物車的功能有一定的同質(zhì)性,關于這一點,淘寶沒有做明顯的區(qū)分,導致購物車只是簡便版的收藏。反觀同電商領域的拼多多,沒有設置購物車功能,并且成交環(huán)節(jié)縮短至4步。
根據(jù)用戶消費偏好分析,將流量更多地聚焦于暢銷的商品,通過明星效應/網(wǎng)紅推薦,結合主題活動和節(jié)日,打造爆款的產(chǎn)品,并利用爆款產(chǎn)品帶動整體商品的銷售。
根據(jù)RFM用戶價值分類結果,一般挽留用戶存在流失風險,可適當給予折扣或捆綁銷售政策,通過一些補貼優(yōu)惠,培養(yǎng)用戶的購買習慣。一般發(fā)展用戶存在價值潛力,要想辦法主動聯(lián)系客戶,如短信、郵件、push提醒等方法,進行好物推薦等,提高用戶的復購率。重要價值客戶其交易時間間隔短,消費頻率高,消費金額高,應加強交流與互動,比如優(yōu)化個人信息界面,加入成長值系統(tǒng),到達一定等級,享受一些特權或優(yōu)惠,可參考騰訊游戲的心悅會員制度。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10