99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁(yè)精彩閱讀數(shù)據(jù)挖掘應(yīng)用案例:RFM模型分析與客戶細(xì)分
數(shù)據(jù)挖掘應(yīng)用案例:RFM模型分析與客戶細(xì)分
2016-01-15
收藏


數(shù)據(jù)挖掘應(yīng)用案例:RFM模型分析與客戶細(xì)分

手機(jī)充值業(yè)務(wù)是一項(xiàng)主要電信業(yè)務(wù)形式,客戶的充值行為記錄正好滿足RFM模型的交易數(shù)據(jù)要求。根據(jù)美國(guó)數(shù)據(jù)庫(kù)營(yíng)銷研究所Arthur Hughes的研究,客戶數(shù)據(jù)庫(kù)中有三個(gè)神奇的要素,這三個(gè)要素構(gòu)成了數(shù)據(jù)分析最好的指標(biāo)最近一次消費(fèi)(Recency)、消費(fèi)頻率(Frequency)、消費(fèi)金額(Monetary)。

 我早期兩篇博文已詳述了RFM思想和IBM Modeler操作過程,有興趣的朋友可以閱讀!

 RFM模型:R(Recency)表示客戶最近一次購(gòu)買的時(shí)間有多遠(yuǎn),F(xiàn)(Frequency)表示客戶在最近一段時(shí)間內(nèi)購(gòu)買的次數(shù),M  (Monetary)表示客戶在最近一段時(shí)間內(nèi)購(gòu)買的金額。一般原始數(shù)據(jù)為3個(gè)字段:客戶ID、購(gòu)買時(shí)間(日期格式)、購(gòu)買金額,用數(shù)據(jù)挖掘軟件處理,加權(quán)(考慮權(quán)重)得到RFM得分,進(jìn)而可以進(jìn)行客戶細(xì)分,客戶等級(jí)分類,Customer Level Value得分排序等,實(shí)現(xiàn)數(shù)據(jù)庫(kù)營(yíng)銷!

       

這里再次借用@數(shù)據(jù)挖掘與數(shù)據(jù)分析的RFM客戶RFM分類圖。

本次分析用的的軟件工具:IBM SPSS Statistics 19,IBM SPSS Modeler14.1,Tableau7.0,EXCEL和PPT

   因?yàn)镽FM分析僅是項(xiàng)目的一個(gè)小部分分析,但也面臨海量數(shù)據(jù)的處理能力,這一點(diǎn)對(duì)計(jì)算機(jī)的內(nèi)存和硬盤容量都有要求。

  先說說對(duì)海量數(shù)據(jù)挖掘和數(shù)據(jù)處理的一點(diǎn)體會(huì):(僅指?jìng)€(gè)人電腦操作平臺(tái)而言)

  • 一般我們拿到的數(shù)據(jù)都是壓縮格式的文本文件,需要解壓縮,都在G字節(jié)以上存儲(chǔ)單位,一般最好在外置電源移動(dòng)硬盤存儲(chǔ);如果客戶不告知,你大概是不知道有多少記錄和字段的;
  • Modeler挖掘軟件默認(rèn)安裝一般都需要與C盤進(jìn)行數(shù)據(jù)交換,至少需要100G空間預(yù)留,否則讀取數(shù)據(jù)過程中將造成空間不足
  • 海量數(shù)據(jù)處理要有耐心,等待30分鐘以上運(yùn)行出結(jié)果是常有的現(xiàn)象,特別是在進(jìn)行抽樣、合并數(shù)據(jù)、數(shù)據(jù)重構(gòu)、神經(jīng)網(wǎng)絡(luò)建模過程中,要有韌性,否則差一分鐘中斷就悲劇了,呵呵;
  • 數(shù)據(jù)挖掘的準(zhǔn)備階段和數(shù)據(jù)預(yù)處理時(shí)間占整個(gè)項(xiàng)目的70%,我這里說如果是超大數(shù)據(jù)集可能時(shí)間要占到90%以上。一方面是處理費(fèi)時(shí),一方面可能就只能這臺(tái)電腦處理,不能幾臺(tái)電腦同時(shí)操作;
  • 多帶來不同,這是我一直強(qiáng)調(diào)的體驗(yàn)。所以海量數(shù)據(jù)需要用到抽樣技術(shù),用來查看數(shù)據(jù)和預(yù)操作,記住:有時(shí)候即使樣本數(shù)據(jù)正常,也可能全部數(shù)據(jù)有問題。建議數(shù)據(jù)分隔符采用“|”存儲(chǔ);
  • 如何強(qiáng)調(diào)一個(gè)數(shù)據(jù)挖掘項(xiàng)目和挖掘工程師對(duì)行業(yè)的理解和業(yè)務(wù)的洞察都不為過,好的數(shù)據(jù)挖掘一定是市場(chǎng)導(dǎo)向的,當(dāng)然也需要IT人員與市場(chǎng)人員有好的溝通機(jī)制;
  • 數(shù)據(jù)挖掘會(huì)面臨數(shù)據(jù)字典和語(yǔ)義層含義理解,在MetaData元數(shù)據(jù)管理和理解上下功夫會(huì)事半功倍,否則等數(shù)據(jù)重構(gòu)完成發(fā)現(xiàn)問題又要推倒重來,悲劇;
  • 每次海量大數(shù)據(jù)挖掘工作時(shí)都是我上微博最多的時(shí)侯,它真的沒我算的快,只好上微博等它,哈哈!

     傳統(tǒng)RFM分析轉(zhuǎn)換為電信業(yè)務(wù)RFM分析主要思考:

 這里的RFM模型和進(jìn)而細(xì)分客戶僅是數(shù)據(jù)挖掘項(xiàng)目的一個(gè)小部分,假定我們拿到一個(gè)月的客戶充值行為數(shù)據(jù)集(實(shí)際上有六個(gè)月的數(shù)據(jù)),我們們先用IBM Modeler軟件構(gòu)建一個(gè)分析流:

數(shù)據(jù)結(jié)構(gòu)完全滿足RFM分析要求,一個(gè)月的數(shù)據(jù)就有3千萬(wàn)條交易記錄!

我們先用挖掘工具的RFM模型的RFM匯總節(jié)點(diǎn)和RFM分析節(jié)點(diǎn)產(chǎn)生R(Recency)、F(Frequency)、M  (Monetary);

 

 接著我們采用RFM分析節(jié)點(diǎn)就完成了RFM模型基礎(chǔ)數(shù)據(jù)重構(gòu)和整理;

    現(xiàn)在我們得到了RFM模型Recency_Score、Frequency_Score、Monetary_Score和RFM_Score;這里對(duì)RFM得分進(jìn)行了五等分切割,采用100、10、1加權(quán)得到RFM得分表明了125個(gè)RFM魔方塊。

    傳統(tǒng)的RFM模型到此也就完成了,但125個(gè)細(xì)分市場(chǎng)太多啦無法針對(duì)性營(yíng)銷也需要識(shí)別客戶特征和行為,有必要進(jìn)一步細(xì)分客戶群;

       另外:RFM模型其實(shí)僅僅是一種數(shù)據(jù)處理方法,采用數(shù)據(jù)重構(gòu)技術(shù)同樣可以完成,只是這里固化了RFM模塊更簡(jiǎn)單直接,但我們可以采用RFM構(gòu)建數(shù)據(jù)的方式不為RFM也可用該模塊進(jìn)行數(shù)據(jù)重構(gòu)。

        我們可以將得到的數(shù)據(jù)導(dǎo)入到Tableau軟件進(jìn)行描述性分析:(數(shù)據(jù)挖掘軟件在描述性和制表輸出方面非常弱智,哈哈)

我們也可以進(jìn)行不同塊的對(duì)比分析:均值分析、塊類別分析等等

這時(shí)候我們就可以看出Tableau可視化工具的方便性

       接下來,我們繼續(xù)采用挖掘工具對(duì)R、F、M三個(gè)字段進(jìn)行聚類分析,聚類分析主要采用:Kohonen、K-means和Two-step算法:

         這時(shí)候我們要考慮是直接用R(Recency)、F(Frequency)、M  (Monetary)三個(gè)變量還是要進(jìn)行變換,因?yàn)镽、F、M三個(gè)字段的測(cè)量尺度不同最好對(duì)三個(gè)變量進(jìn)行標(biāo)準(zhǔn)化,例如:Z得分(實(shí)際情況可以選擇線性插值法,比較法,對(duì)標(biāo)法等標(biāo)準(zhǔn)化)!另外一個(gè)考慮:就是R、F、M三個(gè)指標(biāo)的權(quán)重該如何考慮,在現(xiàn)實(shí)營(yíng)銷中這三個(gè)指標(biāo)重要性顯然不同!

       有資料研究表明:對(duì)RFM各變量的指標(biāo)權(quán)重問題,Hughes,Arthur認(rèn)為RFM在衡量一個(gè)問題上的權(quán)重是一致的,因而并沒有給予不同的劃分。而Stone,Bob通過對(duì)信用卡的實(shí)證分析,認(rèn)為各個(gè)指標(biāo)的權(quán)重并不相同,應(yīng)該給予頻度最高,近度次之,值度最低的權(quán)重;

        這里我們采用加權(quán)方法:WR=2 WF=3 WM=5的簡(jiǎn)單加權(quán)法(實(shí)際情況需要專家或營(yíng)銷人員測(cè)定);具體選擇哪種聚類方法和聚類數(shù)需要反復(fù)測(cè)試和評(píng)估,同時(shí)也要比較三種方法哪種方式更理想!

下圖是采用快速聚類的結(jié)果:

 以及kohonen神經(jīng)算法的聚類結(jié)果:


接下來我們要識(shí)別聚類結(jié)果的意義和類分析:這里我們可以采用C5.0規(guī)則來識(shí)別不同聚類的特征

其中Two-step兩階段聚類特征圖:

 

采用評(píng)估分析節(jié)點(diǎn)對(duì)C5.0規(guī)則的模型識(shí)別能力進(jìn)行判斷:

       

結(jié)果還不錯(cuò),我們可以分別選擇三種聚類方法,或者選擇一種更易解釋的聚類結(jié)果,這里選擇Kohonen的聚類結(jié)果將聚類字段寫入數(shù)據(jù)集后,為方便我們將數(shù)據(jù)導(dǎo)入SPSS軟件進(jìn)行均值分析和輸出到Excel軟件!

     輸出結(jié)果后將數(shù)據(jù)導(dǎo)入Excel,將R、F、M三個(gè)字段分類與該字段的均值進(jìn)行比較,利用Excel軟件的條件格式給出與均值比較的趨勢(shì)!結(jié)合RFM模型魔方塊的分類識(shí)別客戶類型:通過RFM分析將客戶群體劃分成重要保持客戶、重要發(fā)展客戶、重要挽留客戶、一般重要客戶、一般客戶、無價(jià)值客戶等六個(gè)級(jí)別;(有可能某個(gè)級(jí)別不存在);

  另外一個(gè)考慮是針對(duì)R、F、M三個(gè)指標(biāo)的標(biāo)準(zhǔn)化得分按聚類結(jié)果進(jìn)行加權(quán)計(jì)算,然后進(jìn)行綜合得分排名,識(shí)別各個(gè)類別的客戶價(jià)值水平;

至此如果我們通過對(duì)RFM模型分析和進(jìn)行的客戶細(xì)分滿意的話,可能分析就此結(jié)束!如果我們還有客戶背景資料信息庫(kù),可以將聚類結(jié)果和RFM得分作為自變量進(jìn)行其他數(shù)據(jù)挖掘建模工作(數(shù)據(jù)分析師認(rèn)證)!

數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請(qǐng)參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }