
數(shù)據(jù)挖掘技術(shù):客戶價值分析
使用RFM方法(最近購買日Recency, 各期購買頻率Frequency, 各期平均單次購買金額Monetary)能夠科學(xué)地預(yù)測老客戶(有交易客戶)今后的購買金額,再對銷售毛利率、關(guān)系營銷費用進行推算,就能按年、按季、按月分析出今后幾期的客戶價值。
在這里,客戶價值指CRM毛利。CRM毛利 = 購買金額 – 產(chǎn)品成本 – 關(guān)系營銷費用。
RFM方法是國際上最成熟、最為接受的客戶價值分析方法,RFM實際上是一整套分析方法中的部分內(nèi)容,但最具代表性,其它還包括客戶購買行為隨機模型、馬可夫鏈狀態(tài)移轉(zhuǎn)矩陣方法、貝氏機率推導(dǎo)狀態(tài)移轉(zhuǎn)概率方法、回歸擬合方法等。
一、客戶購買行為隨機模型中隱藏著哪些秘密?
隨機模型除了顯示購買頻率概率、平均金額概率的密度分配,還隱藏著購買頻率、平均金額的狀態(tài)移轉(zhuǎn)期望值和概率這兩個秘密,等待被揭示。
揭秘后,您就更加理解用必要長度和寬度的樣本數(shù)據(jù)建立起一套牢固、可靠隨機模型的重要意義,樣本越大,客戶價值推測結(jié)果就越接近即將發(fā)生的事情。
【客戶隨機購買行為的六個基本假設(shè)】
假設(shè)一:假設(shè)客戶隨機購買頻率和隨機購買金額兩個不同的行為緯度互相獨立,不具有相關(guān)性。
假設(shè)二:假設(shè)客戶的購買狀態(tài)移轉(zhuǎn)行為符合馬可夫鏈的假設(shè),這表示客戶下一期購買狀態(tài)發(fā)生的機率只和上一期的購買狀態(tài)有關(guān)。
假設(shè)三:假設(shè)個別客戶購買頻率為卜松分配(Poisson Distribution)。
假設(shè)四:考慮客戶的異質(zhì)性,假設(shè)上述個別客戶單位時間平均購買次數(shù)服從伽瑪分配(Gamma Distribution)。
假設(shè)五:假設(shè)個別客戶有購買行為的各期平均單次購買金額為伽瑪分配(Gamma Distribution)。
假設(shè)六:考慮客戶的異質(zhì)性,假設(shè)上述各期平均單次購買金額又符合另一個伽瑪分配(Gamma Distribution)。
1、觀察隨機模型
頻率概率分布列
平均金額概率密度
a=1.84, b=2.67
p=8.57, q=1.53, k=3224.15圖1圖2
曲線形狀均由其參數(shù)a、b、p、q、k決定。
頻率概率分布列符合負二項分配,參數(shù)a、b由客戶的平均購買頻率計算出來。假設(shè)有一組樣本,對應(yīng)n家成交客戶,fi(i = 1, 2 … n)【樣本長度為n】表示每家客戶的平均購買次數(shù),通過最大概似估計法可求得a、b,并且可求得平均頻率 = b/a。頻率模型為離散函數(shù),f>0,頻率平均值=ceil(b/a)=ceil(2.67/1.84)=2。示例的無成交概率分布列P(0)≈31%,意味著其余有成交概率分布列之和ΣP(i)≈69%,其中P(1)≈30%(峰值),P(2)≈19%,P(3)≈10%。
平均金額概率密度符合伽瑪-伽瑪分配,參數(shù)p、q、k由客戶的平均購買金額計算出來。假設(shè)共有n家客戶【樣本長度為n】,且每家客戶有發(fā)生購買行為的期數(shù)分別為hk(k=1, 2 … n)【樣本寬度分別為hk】,每家客戶有發(fā)生購買行為期間的該期平均單次購買金額為mi,j(i=1, 2, … n, j=1, 2, … hi),通過最大概似估計法可求得p、q、k,并且可求得對應(yīng)峰值概率的平均金額 = (p-1)/(q+1)*k。平均金額m的概率密度分配為連續(xù)函數(shù),m>0,p、q為形狀參數(shù),k為尺度參數(shù)。示例的峰值概率密度位于m=9646.96,P(9646.96)=0.00003323598657260607。
從上面隨機模型中您已能初步觀察到購買頻率、平均金額的概率分布情況。
2、推導(dǎo)購買頻率、平均金額移轉(zhuǎn)期望值
以平均金額為例,觀察以下圖形:
藍色的就是平均金額概率密度曲線,紫色的是m軸每個mi坐標乘以對應(yīng)藍色概率密度pi得到的新曲線。換句話說,紫色包絡(luò)線上每個點的值都是藍色包絡(luò)線對應(yīng)點的mi倍。
在上圖任意位置mi作條垂線,垂線至m=500,000.00(假設(shè)此為歷史最大平均金額)之間,紫色面積除以藍色面積,結(jié)果就是mi的狀態(tài)移轉(zhuǎn)期望值??蓪設(shè)定一些刻度,如0.01、1,000.00、10,000.00、100,000.00、200,000.00、300,000.00、400,000.00,即可得到這些刻度的對應(yīng)的平均金額移轉(zhuǎn)期望值。
用積分表達式描述就是:平均金額移轉(zhuǎn)期望值 = ∫紫色曲線函數(shù)dm / ∫藍色曲線函數(shù)dm,積分區(qū)間由mi到500,000.00。
購買頻率移轉(zhuǎn)期望值也類似,只是頻率概率為離散函數(shù)。
3、推導(dǎo)購買頻率、平均金額移轉(zhuǎn)概率
從隨機模型推導(dǎo)移轉(zhuǎn)概率要復(fù)雜些,與上述求面積不同,它是一個求體積的計算(二重積分),較為抽象。
二重積分在直角坐標系中求體積的示意圖如右。下面我們換個角度,不在三維坐標系中談體積積分,而是繼續(xù)用求面積這種更直觀的方式來推導(dǎo)平均金額移轉(zhuǎn)概率。
基礎(chǔ)知識:客戶從上期狀態(tài)移轉(zhuǎn)至下期狀態(tài),在馬可夫鏈中記作(r1, f1, a1≤m1<b1) → (r2, f2, a2≤m2<b2),r表示未成交期數(shù),f表示該期間成交頻率,m表示該期間的平均成交金額。若下期成交,則r2=0;若下期不成交,則r2=r1+1;以此類推。
圖4 平均金額由m1移轉(zhuǎn)到m2的移轉(zhuǎn)概率記作fm(m2 | a1≤m1<b1),由于金額為連續(xù)變量,對金額劃段后m1屬于a1至b1這個分段內(nèi)。
與推導(dǎo)移轉(zhuǎn)期望值相似,當期望值m2分別等于0.01、1,000.00、10,000.00、100,000.00、200,000.00、300,000.00、400,000.00時,也可用下圖的a1至b1之間的綠色面積除以對應(yīng)的藍色面積來推到平均金額的移轉(zhuǎn)概率。
圖5中的藍色曲線就是圖2的平均金額概率密度函數(shù)。綠色曲線就不是平均金額概率密度pi去乘以m坐標軸的每個對應(yīng)mi,而是去乘以另一個貝氏事后機率密度函數(shù),這個函數(shù)是{[Γ(2p+q) * m2p-1 * (k+m1)p+q] / [Γ(p) * Γ(p+q) * (m2+m1+k)2p+q]},它是通過由果導(dǎo)因的方法獲得。
當m2分別等于0.01, 1,000.00, … 400,000.00時,就得到圖5的不同圖形。當m2等于某值時,用m軸a1至b1之間的綠色面積除以對應(yīng)的藍色面積就得到平均金額移轉(zhuǎn)概率fm(m2 | a1≤m1<b1)。
用積分表達式就是:
fm(m2 | a1≤m1<b1) = H / L
其中H = ∫a1b1[Γ(2p+q) * m2p-1 * (k+m1)p+q] / [Γ(p) * Γ(p+q) * (m2+m1+k)2p+q] * [P(m1 | p,q,k)] dm1
其中L = ∫a1b1[P(m | p,q,k)] dm
而實際上m2也是一個連續(xù)變量,從a1≤m1<b1移轉(zhuǎn)到a2≤m2<b2的移轉(zhuǎn)概率是一個二重積分,積分表達式為:
fm(a2≤m2<b2 | a1≤m1<b1) = ∫a2b2fm(m2 | a1≤m1<b1) dm2
類似地,也使用貝氏機率方法推導(dǎo)頻率移轉(zhuǎn)概率,馬可夫鏈中的r1值(無成交期數(shù))、頻率隨機模型中的信任區(qū)間也是兩個重要計算因素。
4、購買頻率、平均金額移轉(zhuǎn)期望值及移轉(zhuǎn)概率計算
針對上述舉例,移轉(zhuǎn)期望值及移轉(zhuǎn)概率的推導(dǎo)結(jié)果如下:
樣本數(shù)據(jù)的最小頻率=1,最大頻率=3:樣本數(shù)據(jù)的最小平均金額=0.01,最大平均金額=499,999.00:最近成交期的頻率f1
下期的頻率期望值f2最近成交期至下期的未成交期數(shù)r1
下期的頻率期望值概率pf1≥1 → f2≥2r1=0, p=0.3606;r1=1, p=0.2949
r1=2, p=0.2356;r1=3, p=0.1892f1≥2 → f2≥2r1=0, p=0.3606;r1=1, p=0.2949
r1=2, p=0.2356;r1=3, p=0.1892f1≥3 → f2≥3r1=0, p=0.1367;r1=1, p=0.0958
r1=2, p=0.0669;r1=3, p=0.0477最近一期平均金額m1下期平均金額的期望值m2、概率p0.01≤m1<1,000.00m2=39,510.75,p=0.01261,000.00≤m1<10,000.00m2=39,598.21,p=0.371910,000.00≤m1<100,000.00m2=46,920.90,p=0.8754100,000.00≤m1<200,000.00m2=186,871.69,p=0.4707200,000.00≤m1<300,000.00m2=296,732.74,p=0.3049300,000.00≤m1<400,000.00m2=379,455.72,p=0.2227400,000.00≤m1<500,000.00m2=445,441.60,p=0.1748
某客戶下期的購買金額 = (該客戶的)下期頻率 * 下期平均金額 * 下期頻率概率 * 下期平均金額概率
二、預(yù)測下期產(chǎn)品成本和關(guān)系營銷費用
CRM毛利 = 購買金額 – 產(chǎn)品成本 – 關(guān)系營銷費用。
RFM只預(yù)測客戶下期的購買金額,RFM并不預(yù)測下期的毛利率和費用。對個別客戶以往的毛利率、費用采取平均法或移動平均法,應(yīng)用于下期,該推斷顯然不合適;采取如RFM的概率分析方法去推斷下期毛利率和費用也不合適,因為這兩者并不是源自客戶(或企業(yè)、員工)的隨機行為,而更是源自企業(yè)總體成本控制和差別應(yīng)對。
【銷售毛利率、關(guān)系營銷費用的五個基本假設(shè)】
假設(shè)1:假設(shè)銷售毛利率和關(guān)系營銷費用不是隨機現(xiàn)象,并且毛利率、費用遵循各自的發(fā)生規(guī)律。
假設(shè)2:假設(shè)個別客戶下期的銷售毛利率最接近該客戶有成交上期的毛利率。
假設(shè)3:假設(shè)個別客戶上期、下期之間存在無交易期數(shù),則下期銷售毛利率的升、降,服從該客戶在無交易期間的企業(yè)整體毛利率的擬合回歸規(guī)律。
假設(shè)4:假設(shè)個別客戶下期的關(guān)系營銷費用服從該客戶以往的費用、購買金額比例,即服從關(guān)系營銷投入產(chǎn)出比。
假設(shè)5:假設(shè)個別客戶下期可能存在一個最小關(guān)系營銷費用基數(shù),它相當于該客戶以往各期費用中的最低值。
1、下期產(chǎn)品成本
下期產(chǎn)品成本 = 下期購買金額 * (1 – 下期銷售毛利率)
如果某客戶上、下期之間無交易期數(shù)為0,則下期毛利率 = 上期毛利率。上期指有成交的最近一期。
如果某客戶上、下期之間無交易期數(shù)為r1 (r1>0),則下期毛利率 = 上期毛利率 * (1 + Δ)。其中Δ = (上期至r1=0期之間的)線性回歸方程的斜率 * r1 / 2,用Δ對毛利率進行微調(diào)。之所以采用線性擬合回歸,是因為決定系數(shù)R2在這里并不重要,我們僅是求得無交易期間的企業(yè)整體毛利率升、降趨勢,并且不是用擬合回歸方程本身去預(yù)測下期毛利率。
2、下期關(guān)系營銷費用
定義:Ratei = Σ客戶i以往費用 / Σ客戶i以往購買金額
Expensei = 客戶i以往各期中最小的那期費用(大于0)
Monetaryi = 客戶i下期購買金額
Xi = Monetaryi * Ratei
如果Xi > Expensei,則下期費用 = Xi;
否則如果Monetaryi < Expensei,則下期費用 = Xi;
否則,下期費用 = Expensei。
3、在SynleadCRM 2008中,對下期的毛利率和費用還可手工修正
用SynleadCRM 2008分析客戶價值時,選項“提取產(chǎn)品成本”表示提取以往產(chǎn)品成本并推算今后幾期的產(chǎn)品成本,選項“提取費用”表示提取以往關(guān)系營銷費用并推算今后幾期的關(guān)系營銷費用。前面提到,產(chǎn)品成本和關(guān)系營銷費用屬于企業(yè)總體成本控制和差別應(yīng)對,其未來變化不一定按趨勢平滑,可能下期個別客戶或整體客戶群的情況出現(xiàn)逆反或抖動。依據(jù)您的判斷,在SynleadCRM 2008中對下期的毛利率和費用還可手工個別/批量地調(diào)整、修正。
另一方面,也可能出現(xiàn)少許產(chǎn)品成本、費用數(shù)據(jù)沒有及時填寫進CRM系統(tǒng),例如“機會-產(chǎn)品”中未及時填寫或更新產(chǎn)品/銷售價/成本價,造成統(tǒng)計時產(chǎn)品成本=0.00、毛利率=100%;或者極特殊的數(shù)據(jù)沒有排除,例如上期毛利率為負值。該情況也需要對個別客戶的下期毛利率進行手工修正。
三、完整客戶關(guān)系生命周期內(nèi)的客戶價值
客戶價值 = CRM毛利 = 購買金額 – 產(chǎn)品成本 – 關(guān)系營銷費用。在完整客戶關(guān)系生命周期內(nèi)(從建立關(guān)系到未流失的最近一期),分析客戶今后價值的意義遠遠大于分析客戶歷史價值,因此通常所講的客戶價值分析是對客戶今后的價值進行分析。
SynleadCRM 2008為您分析客戶今后三期價值的同時,也向您展示客戶的歷史價值作為參照。
圖7 對預(yù)測出的今后客戶價值結(jié)果,您就可按客戶價值分層。CRM客戶關(guān)系管理將傳統(tǒng)的整體營銷推進到分塊差別化營銷、一對一差別化營銷的高度,其立足點就是客戶價值差別化分析。
通過預(yù)測客戶價值,您就清楚一旦VIP客戶、大客戶流失將在今后造成怎樣的利潤損失;也可以找出那些臨近虧本或負價值的客戶,進行置疑分析,找出對策。
也要清醒地認識到,即便預(yù)測出的客戶價值較高,也只是說明其價值勢能(購買潛力)較高,坐等客戶送上門的價值動能(實際購買)是不現(xiàn)實的,必須回過頭去用CRM基礎(chǔ)方法論踏踏實實地與客戶互動,推動客戶追加購買、交叉購買。
客戶價值分析,是企業(yè)決策最重要的依據(jù)之一,請做好您企業(yè)的客戶價值分析,正確指引商務(wù)運營。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10