
大白話講解數(shù)據(jù)挖掘【案例】潛客模型的數(shù)據(jù)框架
本篇文章作為回答很多朋友問我的一個問題:到底數(shù)據(jù)挖掘是什么?有什么作用?
我把數(shù)據(jù)挖掘比喻成炒菜燒飯。下面用了一個潛客模型的框架作為案例進(jìn)行講解。
(潛客模型數(shù)據(jù)挖掘框架)
因為我在互聯(lián)網(wǎng)公司,所以流量是整個流程圖的開始。
第一步:數(shù)據(jù)準(zhǔn)備(去菜場買食材,到家清洗食材)
第二步:做模型(將食材加工成各類食物,咸味、甜味、淡味)
第三步:數(shù)據(jù)CRM系統(tǒng)營銷管理(把不同的食物分給不同的人吃)
第四步:做評估(反饋不同人群對菜的評價,反饋給廚師,廚師根據(jù)反饋再做改進(jìn))
可以看到數(shù)據(jù)挖掘非常類似廚師的工作。我們來細(xì)細(xì)得看一下每一步大概要考慮什么問題?如何去解決吧?
第一步:數(shù)據(jù)準(zhǔn)備
問題:
1、怎么收集用戶信息? (去哪里買食材)
收集用戶信息可以是非常多的形式,但我們不可能無限制得到用戶信息,那是非常浪費資源并且也會讓用戶認(rèn)為我們不友好。(就比如你在上海不會飛去北京買烤鴨吧?)所以使用哪些用戶信息這個問題就非常關(guān)鍵。
2、應(yīng)該使用哪些用戶信息? (買哪些食材)
通常我們會把所有的一些字段都羅列出來(附近菜場能買到的食材全部記錄下來),然后用于模型軟件和建模專家去評估哪些字段是有用的(去看哪些能做出菜品的),哪些字段可能對于模型沒有任何作用。目前較為流行的就是用戶的交互信息,因為這些信息最不易作假,來源也最方便。
第二步:做模型
問題:如何建模?(如何燒菜)
建模其實就是將你手中的信息量折合成你需要的信息。(把幾個食材加工后變成紅燒肉)。比如要預(yù)測這個用戶是否要流失,你可以用最近用戶的交易習(xí)慣是否有巨大的改變,這時我們做模型可能只需要幾個關(guān)鍵變量(食材)。從原來的幾百個關(guān)鍵變量到最后的幾個關(guān)鍵變量,然后把他們組合起來這一個過程就是建模的過程。(選食材到做出美味的美食的過程)
做模型其實是一件非常耗費時間的事情,因為在沒有專業(yè)化軟件的時候,大家做模型就是靠業(yè)務(wù)經(jīng)驗及一遍遍的數(shù)據(jù)組合去完成的。而現(xiàn)在專業(yè)化的工具如R,SAS,SPSS等其實是提高了建模師的工作效率,讓他們繁瑣且重復(fù)化的工作由計算機(jī)完成。當(dāng)然在你使用這些軟件的同時,你必須了解每一種數(shù)學(xué)模型背后的原理,這樣你才明白什么時候用什么模型。(數(shù)學(xué)模型就好像油鹽醬醋,要知道什么時候用什么,最終才能做出美味)
做完模型后,有時你需要把你的模型解釋給業(yè)務(wù)部門聽,然后告訴他們?nèi)绾问褂媚愕哪P?,因為幫助解決問題才是模型的最終目標(biāo)。
第三步:數(shù)據(jù)CRM系統(tǒng)營銷管理
當(dāng)我們把每個顧客的菜做好了,我們需要對不同的顧客滿足不同的需求,這時就用到了CRM系統(tǒng),如下圖所示,可以根據(jù)模型進(jìn)行營銷,檢測最后是否解決了業(yè)務(wù)問題。
CRM具有以下優(yōu)勢:
1、在營銷之前你就可以預(yù)算營銷成本。
2、針對不同用戶使用不同的營銷策略(常說的精確化營銷)
3、易于檢測營銷和模型結(jié)果
第四步:結(jié)果反饋及模型優(yōu)化
重要結(jié)果反饋KPI:(只例舉部分)
正向反饋:1、用戶再次訪問客戶端或網(wǎng)站的概率
2、用戶上線下單購買產(chǎn)品概率
反向反饋:1、退訂率(E-mail APP)
2、投訴率
3、未響應(yīng)度(未采取任何動作)
根據(jù)不同類型的人群進(jìn)行的反饋結(jié)果再次檢驗?zāi)P?顧客的口味評價),查看模型的準(zhǔn)確度是否在可控范圍內(nèi)。很多模型隨著時間推移都會變得不準(zhǔn)確,需要調(diào)整一定的閥值。比如銀行的風(fēng)控模型,通常都會半年到1年調(diào)整一次(廚師根據(jù)顧客喜好調(diào)整口味)。其中的原因可能是經(jīng)濟(jì)條件增長原因,也可以能是銀行政策原因?qū)е隆?
總結(jié)項目關(guān)鍵點:
1、 收集用戶的信息質(zhì)量(業(yè)務(wù)及BI部門合作)
2、 算法優(yōu)化處理(建模工程師)
3、 系統(tǒng)實施跟進(jìn)(BI及IT開發(fā)部門合作)
這些因素決定模型應(yīng)用的成敗。
PS:數(shù)據(jù)挖掘有很多有意思的應(yīng)用,典型的亞馬遜推薦算法;啤酒與尿布;預(yù)測;語音識別的原理中也有概率數(shù)據(jù)挖掘的影子(推薦閱讀《數(shù)學(xué)之美》)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03