
小談關(guān)聯(lián)規(guī)則的指標(biāo)應(yīng)用
你對(duì)關(guān)聯(lián)規(guī)則知道多少呢?本文從概念和基本指標(biāo)說起,向你介紹一些指標(biāo)應(yīng)用的方法。
關(guān)聯(lián)規(guī)則是產(chǎn)品推薦中最常用的算法之一,簡(jiǎn)單地說,就是通過客戶的歷史購(gòu)買信息,挖掘出客戶在所有產(chǎn)品間按照某種順序進(jìn)行選擇的可能性。然而,關(guān)聯(lián)規(guī)則中的常用度量指標(biāo)并不唯一,三四個(gè)指標(biāo)相互聯(lián)系,如何進(jìn)行合理的排列組合、找出值得向客戶推薦的產(chǎn)品呢?我們將從簡(jiǎn)化的實(shí)際場(chǎng)景跟大家探討一下究竟如何應(yīng)用這些指標(biāo)去做產(chǎn)品推薦。
首先,我們先來了解一下關(guān)聯(lián)規(guī)則中所涉及到的一些指標(biāo):
1. 產(chǎn)品的期望概率
產(chǎn)品期望概率就是對(duì)于任意一個(gè)客戶來說,購(gòu)買某一產(chǎn)品的可能性。
如果我們現(xiàn)在有兩個(gè)產(chǎn)品A和B,那么A、B的期望概率就是所有客戶中購(gòu)買了產(chǎn)品A或者產(chǎn)品B的比例,也就是P(A)和P(B)。
2. 產(chǎn)品的置信度和支持度
置信度是用來衡量客戶在選擇一個(gè)產(chǎn)品(即前項(xiàng)產(chǎn)品)后,又選擇另一個(gè)產(chǎn)品(即后項(xiàng)產(chǎn)品)的可能性。比如,我們想知道有多少客戶選擇了A之后又選擇了B,其實(shí)就是統(tǒng)計(jì)學(xué)中條件概率,表達(dá)式為:
P(B|A)=P(A,B)/P(A)
分母中P(A,B)的意思為同時(shí)選擇A、B的概率,也就是關(guān)聯(lián)規(guī)則中的支持度。從公式中,我們可以看出,置信度就是支持度與產(chǎn)品A(前項(xiàng)產(chǎn)品)期望概率的比值。
3. 產(chǎn)品的提升度
那么,是不是產(chǎn)品的置信度越高,我們就越應(yīng)該給買了產(chǎn)品A的客戶推薦產(chǎn)品B呢?
答案并非如此。舉個(gè)例子來說,如果產(chǎn)品B是一個(gè)特別大眾的產(chǎn)品,幾乎所有客戶都會(huì)購(gòu)買,而產(chǎn)品A卻是一種小眾產(chǎn)品,只有一小撮人會(huì)購(gòu)買,那么,置信度
P(B|A)=P(A,B)/P(A)
會(huì)無限接近于1,相應(yīng)的支持度也會(huì)很高。也就是說,雖然購(gòu)買了產(chǎn)品B客戶客幾乎都會(huì)購(gòu)買產(chǎn)品A,但產(chǎn)品B的高購(gòu)買率并非受益于產(chǎn)品A,不是因?yàn)榭蛻粝荣?gòu)買了產(chǎn)品A帶來的提升。
所以,為了測(cè)量先購(gòu)買某一產(chǎn)品對(duì)另一產(chǎn)品購(gòu)買度的提升比例,關(guān)聯(lián)規(guī)則中提出了提升度這一指標(biāo),表達(dá)式為置信度與后項(xiàng)產(chǎn)品期望概率的比值,即
P(B|A)/P(B)=P(A,B)/(P(A)*P(B))
只有當(dāng)提升度大于1,才能說明購(gòu)買過產(chǎn)品A的客戶比任意一個(gè)客戶有更高可能性去購(gòu)買產(chǎn)品B,才有推薦的必要性。
通常在關(guān)聯(lián)規(guī)則中,我們會(huì)采用Apriori算法去計(jì)算以上指標(biāo),篇幅所限,具體算法就不再細(xì)說了,感興趣的讀者可以尋找相關(guān)資料。下面就展示一個(gè)通過算法得到的規(guī)則表吧,來看看業(yè)務(wù)中會(huì)用到的信息究竟長(zhǎng)什么樣吧:
需要注意的是,在算法中我們已經(jīng)自行排除了一些出現(xiàn)概率較低的規(guī)則,一般會(huì)將產(chǎn)品同時(shí)發(fā)生率和置信度根據(jù)數(shù)據(jù)本身的情況設(shè)定一個(gè)閾值。
但是,有了以上幾個(gè)指標(biāo)數(shù)據(jù)之后,我們又要如何給客戶進(jìn)行產(chǎn)品推薦呢?實(shí)際應(yīng)用中,我們可以從兩個(gè)方向出發(fā):
1. 以規(guī)則為導(dǎo)向
舉個(gè)例子,現(xiàn)在有一個(gè)客戶進(jìn)入店中,我們通過歷史信息知道了他曾經(jīng)購(gòu)買過何種產(chǎn)品,接下來我們要如何給他做推薦呢?
以規(guī)則為導(dǎo)向的意思是說,通過篩選購(gòu)買前項(xiàng)產(chǎn)品的客戶群,來推薦其購(gòu)買右邊的產(chǎn)品。這里其實(shí)需要解決兩個(gè)問題,一是客戶購(gòu)買了多種產(chǎn)品,那要針對(duì)哪一種種前項(xiàng)產(chǎn)品做推薦呢?二是對(duì)于同一前項(xiàng)產(chǎn)品,又該推薦何種后項(xiàng)產(chǎn)品呢?
解決這兩個(gè)問題也就是要解決兩個(gè)順序,即前項(xiàng)產(chǎn)品的推薦排序和相同前項(xiàng)產(chǎn)品下的后項(xiàng)產(chǎn)品排序。前項(xiàng)產(chǎn)品推薦排序方面,建議以前項(xiàng)產(chǎn)品的期望概率出發(fā),從大到小進(jìn)行排序。當(dāng)確定了前項(xiàng)產(chǎn)品后,推薦后項(xiàng)產(chǎn)品的順序則應(yīng)該綜合考慮提升度和置信度。由于提升度的大小是由置信度(分母)和后項(xiàng)期望概率(分子)的比值決定,所以會(huì)存在由于后項(xiàng)期望概率(分子)過小、而導(dǎo)致提升度反而比較大的情況。因此,在后項(xiàng)推薦的時(shí)候,如果一定要有個(gè)先后順序,則是先篩選出提升度大于1的規(guī)則,隨后再根據(jù)置信度的大小進(jìn)行排序。
2. 以產(chǎn)品為導(dǎo)向
以產(chǎn)品為導(dǎo)向,意味著你有一款待銷的產(chǎn)品,需要通過回溯規(guī)則的左邊,找到最有可能購(gòu)買的客戶。這種情況下,我們已經(jīng)確定了后項(xiàng)期望概率,就可以同樣通過提升度大于1的規(guī)則,隨后在根據(jù)置信度的大小進(jìn)行排序,找到推薦關(guān)系比較強(qiáng)的產(chǎn)品的購(gòu)買者。
以上簡(jiǎn)單介紹了關(guān)聯(lián)規(guī)則在實(shí)際場(chǎng)景中的指標(biāo)應(yīng)用問題,希望對(duì)大家能夠有所啟發(fā)。當(dāng)然,關(guān)聯(lián)規(guī)則使用中,有些還會(huì)結(jié)合分群客戶協(xié)同過濾的方法,有機(jī)會(huì)再和大家詳細(xì)聊聊。數(shù)據(jù)分析培訓(xùn)
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03