
數(shù)據(jù)挖掘應(yīng)用案例:RFM模型分析與客戶細分
手機充值業(yè)務(wù)是一項主要電信業(yè)務(wù)形式,客戶的充值行為記錄正好滿足RFM模型的交易數(shù)據(jù)要求。根據(jù)美國數(shù)據(jù)庫營銷研究所Arthur Hughes的研究,客戶數(shù)據(jù)庫中有三個神奇的要素,這三個要素構(gòu)成了數(shù)據(jù)分析最好的指標:最近一次消費(Recency)、消費頻率(Frequency)、消費金額(Monetary)。
我早期兩篇博文已詳述了RFM思想和IBM Modeler操作過程,有興趣的朋友可以閱讀!
RFM模型:R(Recency)表示客戶最近一次購買的時間有多遠,F(xiàn)(Frequency)表示客戶在最近一段時間內(nèi)購買的次數(shù),M (Monetary)表示客戶在最近一段時間內(nèi)購買的金額。一般原始數(shù)據(jù)為3個字段:客戶ID、購買時間(日期格式)、購買金額,用數(shù)據(jù)挖掘軟件處理,加權(quán)(考慮權(quán)重)得到RFM得分,進而可以進行客戶細分,客戶等級分類,Customer Level Value得分排序等,實現(xiàn)數(shù)據(jù)庫營銷!
這里再次借用@數(shù)據(jù)挖掘與數(shù)據(jù)分析的RFM客戶RFM分類圖。
本次分析用的的軟件工具:IBM SPSS Statistics 19,IBM SPSS Modeler14.1,Tableau7.0,EXCEL和PPT
因為RFM分析僅是項目的一個小部分分析,但也面臨海量數(shù)據(jù)的處理能力,這一點對計算機的內(nèi)存和硬盤容量都有要求。
先說說對海量數(shù)據(jù)挖掘和數(shù)據(jù)處理的一點體會:(僅指個人電腦操作平臺而言)
傳統(tǒng)RFM分析轉(zhuǎn)換為電信業(yè)務(wù)RFM分析主要思考:
這里的RFM模型和進而細分客戶僅是數(shù)據(jù)挖掘項目的一個小部分,假定我們拿到一個月的客戶充值行為數(shù)據(jù)集(實際上有六個月的數(shù)據(jù)),我們們先用IBM Modeler軟件構(gòu)建一個分析流:
數(shù)據(jù)結(jié)構(gòu)完全滿足RFM分析要求,一個月的數(shù)據(jù)就有3千萬條交易記錄!
我們先用挖掘工具的RFM模型的RFM匯總節(jié)點和RFM分析節(jié)點產(chǎn)生R(Recency)、F(Frequency)、M (Monetary);
接著我們采用RFM分析節(jié)點就完成了RFM模型基礎(chǔ)數(shù)據(jù)重構(gòu)和整理;
現(xiàn)在我們得到了RFM模型的Recency_Score、Frequency_Score、Monetary_Score和RFM_Score;這里對RFM得分進行了五等分切割,采用100、10、1加權(quán)得到RFM得分表明了125個RFM魔方塊。
傳統(tǒng)的RFM模型到此也就完成了,但125個細分市場太多啦無法針對性營銷也需要識別客戶特征和行為,有必要進一步細分客戶群;
另外:RFM模型其實僅僅是一種數(shù)據(jù)處理方法,采用數(shù)據(jù)重構(gòu)技術(shù)同樣可以完成,只是這里固化了RFM模塊更簡單直接,但我們可以采用RFM構(gòu)建數(shù)據(jù)的方式不為RFM也可用該模塊進行數(shù)據(jù)重構(gòu)。
我們可以將得到的數(shù)據(jù)導(dǎo)入到Tableau軟件進行描述性分析:(數(shù)據(jù)挖掘軟件在描述性和制表輸出方面非常弱智,哈哈)
我們也可以進行不同塊的對比分析:均值分析、塊類別分析等等
這時候我們就可以看出Tableau可視化工具的方便性
接下來,我們繼續(xù)采用挖掘工具對R、F、M三個字段進行聚類分析,聚類分析主要采用:Kohonen、K-means和Two-step算法:
這時候我們要考慮是直接用R(Recency)、F(Frequency)、M (Monetary)三個變量還是要進行變換,因為R、F、M三個字段的測量尺度不同最好對三個變量進行標準化,例如:Z得分(實際情況可以選擇線性插值法,比較法,對標法等標準化)!另外一個考慮:就是R、F、M三個指標的權(quán)重該如何考慮,在現(xiàn)實營銷中這三個指標重要性顯然不同!
有資料研究表明:對RFM各變量的指標權(quán)重問題,Hughes,Arthur認為RFM在衡量一個問題上的權(quán)重是一致的,因而并沒有給予不同的劃分。而Stone,Bob通過對信用卡的實證分析,認為各個指標的權(quán)重并不相同,應(yīng)該給予頻度最高,近度次之,值度最低的權(quán)重;
這里我們采用加權(quán)方法:WR=2 WF=3 WM=5的簡單加權(quán)法(實際情況需要專家或營銷人員測定);具體選擇哪種聚類方法和聚類數(shù)需要反復(fù)測試和評估,同時也要比較三種方法哪種方式更理想!
下圖是采用快速聚類的結(jié)果:
以及kohonen神經(jīng)算法的聚類結(jié)果:
接下來我們要識別聚類結(jié)果的意義和類分析:這里我們可以采用C5.0規(guī)則來識別不同聚類的特征:
其中Two-step兩階段聚類特征圖:
采用評估分析節(jié)點對C5.0規(guī)則的模型識別能力進行判斷:
結(jié)果還不錯,我們可以分別選擇三種聚類方法,或者選擇一種更易解釋的聚類結(jié)果,這里選擇Kohonen的聚類結(jié)果將聚類字段寫入數(shù)據(jù)集后,為方便我們將數(shù)據(jù)導(dǎo)入SPSS軟件進行均值分析和輸出到Excel軟件!
輸出結(jié)果后將數(shù)據(jù)導(dǎo)入Excel,將R、F、M三個字段分類與該字段的均值進行比較,利用Excel軟件的條件格式給出與均值比較的趨勢!結(jié)合RFM模型魔方塊的分類識別客戶類型:通過RFM分析將客戶群體劃分成重要保持客戶、重要發(fā)展客戶、重要挽留客戶、一般重要客戶、一般客戶、無價值客戶等六個級別;(有可能某個級別不存在);
另外一個考慮是針對R、F、M三個指標的標準化得分按聚類結(jié)果進行加權(quán)計算,然后進行綜合得分排名,識別各個類別的客戶價值水平;
至此如果我們通過對RFM模型分析和進行的客戶細分滿意的話,可能分析就此結(jié)束!如果我們還有客戶背景資料信息庫,可以將聚類結(jié)果和RFM得分作為自變量進行其他數(shù)據(jù)挖掘建模工作(數(shù)據(jù)分析師認證)!
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10CDA 數(shù)據(jù)分析師:商業(yè)數(shù)據(jù)分析實踐的落地者與價值創(chuàng)造者 商業(yè)數(shù)據(jù)分析的價值,最終要在 “實踐” 中體現(xiàn) —— 脫離業(yè)務(wù)場景的分 ...
2025-09-10機器學(xué)習解決實際問題的核心關(guān)鍵:從業(yè)務(wù)到落地的全流程解析 在人工智能技術(shù)落地的浪潮中,機器學(xué)習作為核心工具,已廣泛應(yīng)用于 ...
2025-09-09SPSS 編碼狀態(tài)區(qū)域中 Unicode 的功能與價值解析 在 SPSS(Statistical Product and Service Solutions,統(tǒng)計產(chǎn)品與服務(wù)解決方案 ...
2025-09-09