
市場細分如何幫助你構建更好的預測模型?
但是,這真的有必要嗎?我們可不可以創(chuàng)建一個單獨的模型和使它含有區(qū)融變量作為模型的輸入。
這可能可以。特別是根據市場細分創(chuàng)建細分模型可能是一件吃力不討好的事情,不值得。但是創(chuàng)建市場細分的相關模型可能能提供更精準的預測。
在本文,我不僅會針對上面的問題給出答案,而且會和大家分享有關模型的最佳市場細分指南。而且,本文也會探索利用復雜技術的市場細分模型方法,如在一個簡單的邏輯或線性回歸框架中使用隨機梯度增加模型和隨機森林模型(雖然使用起來非常有限)。
通過本文,讓大家了解建模流程的相互作用的本質和重復利用上述提到的復雜技術的優(yōu)勢。
我可以從市場的深度給大家解釋這個概念,但是,市場細分為什么能夠令復雜的事情簡單化呢?
因此,我將市場細分定義為:“在一些重要特性的基礎上劃分目標市場和客戶,可以幫助企業(yè)用更少的市場成本銷售更多的產品?!?/span>
企業(yè)的預算是有限的。而且企業(yè)希望市場團隊可以在這樣的情況下完成大量的銷售,確保收入利益不斷增加。在有限的預算中,如何實現利益增收?答案就是:使用市場細分。
讓我們回到前面,了解企業(yè)是如何創(chuàng)造出人們愿意買的產品。
實際上,一個產品的創(chuàng)造有兩種方式:
1、經過對目標市場的需求進行分析研究后創(chuàng)建產品。舉例:電腦。像戴爾,IBM和微軟都是在分析了大量市場并得出電腦市場值得發(fā)展的情況下,才進入這個市場。
2、創(chuàng)建一個產品,能夠喚起目標市場的需求和渴望。舉例:iphone。沒有人知道他們需要觸屏手機,知道喬布斯令他們意識到自己被剝奪了這個需求。
一旦產品被創(chuàng)建出來,市場團隊離成功就更近了。上面提到的,他們利用了市場細分技術。這確保了產品定位在合適的客戶細分群體,可以實現更多的銷售。
這兒有兩個廣義的市場細分方法:目標(有人監(jiān)視的)和無目標的(無人監(jiān)視的)市場細分方法。正如名稱所示,一個帶有監(jiān)視的方法要求目標可作為市場細分來描述。
下面是一些有目標和無目標的方法案例。
目標市場細分:
市場細分確認客戶類型,哪些客戶對特別提供的產品感興趣。
市場細分確定客戶群眾中的高消費人群,誰可以使用電子商務進行刺激消費。
市場細分確定哪些客戶違反了貸款或者信用卡的信貸責任。
無目標的市場細分
客戶基礎的市場細分了解特定畫像,這些畫像存在于客戶基礎之中,因此多樣化的市場行為可以根據細分情況定制。
基于不同地域的人們的富裕程度和生活水平的地理市場細分,形成特定的銷售和配送策略。
基于瀏覽行為的網絡位置參觀者的市場細分,了解品牌的興起和受歡迎程度。
因此,創(chuàng)建基于目標市場細分的方法必須要從不同的方面入手 ,這是很關鍵的。(eg:響應要約)
但是,關于無目標的方法,根據各方面得出的市場細分和觀察結果得到的“通用畫像”不同,但是和 任何特定的追求目標沒關系。
最常用的目標市場細分方法是CHIAD和CRT。這些技術嘗試將已描述的目標的細分之間的差異最大化。(這些目標有時候是所謂市場細分的參考目標)。CHIAD使用X平方分布統(tǒng)計,而CRT使用不純基尼度算法。
創(chuàng)建無目標市場細分的常用技術是聚類分析法和K最近鄰技術(K nearest neighbor techniques)等。
這些技術使用了距離測試方法(如:歐式距離,曼哈頓距離,馬氏距離等)這些測試能把兩個細分之間差異最大化。這意味著市場細分之間的最大區(qū)別是和所有變量(或因素)的結合有關。
1、通常采用的方法
如果你一直在看這篇文章,那么我們已經準備好去深入研究這些創(chuàng)建市場細分的方法。當然,考慮為每個市場細分創(chuàng)建單獨模型作為唯一目標。
讓我們思考下面這個例子:
在這里,我們將創(chuàng)建一個邏輯回歸模型來預測客戶對供給的產品的可能(接受)性。當然也可以使用線性回歸模型。我將在下一節(jié)進行討論。
邏輯回歸:
該模型在歷史運動數據中使用1或0指示,指明客戶對提供的產品是否做出反應。
通常,使用已經被確定了模型發(fā)展的目標(或者已知的“Y”作為獨立變量)來進行市場細分。記住,每個細分將建立單獨的模型。一個市場細分計劃可實現和通常選擇的目標有關的不同市場細分的最大差異。下面是該方法的舉例:
圖1:建立一個邏輯回歸模型的市場細分案例—普遍采用的方法
此圖譯為:
以上市場細分方法是最好的可能用來發(fā)展目標市場細分的方法,因為這些細分演示了跟目標有關的最大區(qū)別。(如:反應率)。
在上面的這棵樹中,每個分割模塊應該代表一個統(tǒng)計學上跟目標有關的不同節(jié)點之間的顯著差異。如果使用CHIAD算法開發(fā)市場細分這棵樹,那么每個分割(單獨)模塊的X平方值應該是從0開始有顯著差異。(通過分割法的“P”值測試)
另外,這是普遍的“商業(yè)直覺”(不是通常都可以擁有完整的統(tǒng)計理由),為了發(fā)展單獨的模型,相鄰節(jié)點之間的反應率應該相差至少30%(如:如果指定節(jié)點的反應率是0.7%,同樣的,它相鄰的節(jié)點是0.5%,那么它們反應率應相差30%)。
通常采用的方法建議應該為每個終端節(jié)點或者結束節(jié)點建立一個單獨的模型,它已經顯示為表中綠色部分。但是,這是從建模的角度得到的最好方法嗎?為了回答這個問題,我們需要找到一個測試方法,可以從建模的角度評價一個市場細分。
為了建立單獨的模型和評價一個市場細分計劃的最有效的方法是提升預測能力,它可以通過建立市場細分模型實現。將用下面的案例進行描述。
讓我們假設一個邏輯模型,是建立在總人口上的,用來預測反應的可能性。
我們設計這個為模型-1(主要分析描述它作為母模型),該模型的基尼度為0.57。市場細分開發(fā)方法的一部分,建立5個單獨的模型,對應每個結束節(jié)點(主要作為子節(jié)點進行分析描述)。
邏輯模型2-1:市場細分“年齡小于30”的預測反應
邏輯模型2-2:市場細分“年齡介于30-48之間,且收入少于800K盧布”的預測反應
邏輯模型2-3:市場細分“年齡介于30-48之間,且收入大于等于800k盧布”的預測反應
邏輯模型2-4:市場細分“年齡大于48,收入少于100萬盧布”的預測反應
邏輯模型2-5:市場細分“年齡大于48,收入大于等于100萬”的預測反應
在建立5個單獨模型之后,各自的觀察結果(或記錄)和5個數據集(針對每個結束節(jié)點)計算得分或者預測可能性是附加的操作。
結合數據集的基尼度將與模型-1的基尼度做對比。然后,兩個系數將被設計去提升預測力量。舉例:如果結合數據集的基尼度為0.6,那么提升后將是1.05。這可以通過圖表看出,雖然市場細分是最佳的可能目標市場細分,但是它僅提供了5%的額外的預測能力的提升。
讓我們尋找為什么該案例會是這個樣子。它應該被提到,當發(fā)展線性模型的時候,應該考慮調整判定系數的提升而不是 基尼系數的提升。
當建立整體模型(模型1),可以使用合適的虛變量法來表示市場細分。比如,可以使用下面的虛系數(它應該根據自由約束度被標記,將有一個小于所有虛擬系數的數)
虛擬-1:年齡小于30,1或0
虛擬-2:年齡介于30-48,1或0
虛擬-3:收入800k盧布
虛擬-4:收入介于800k至100萬盧布
如果使用虛擬數據去重復市場細分樹,那么模型的預測能力將會更好。
虛擬-1:年齡小于30
虛擬-2:年齡介于30和48之間,和收入少于800k盧布
虛擬-3:年齡介于30和48之間,收入超過800K盧布
虛擬-4:年齡超過48且收入少于100萬盧布
這些虛擬變量可以提供反應率相同的差異化,作為5個獨立的細分 。因此,可以通過市場細分看到反應率的差異化,可以通過整個回歸模型的一系列虛擬變量輕易的重復。
但是,這不是預測能力的微提升背后的完整解釋。表二提供了子模型的變量列表。
這些模型的變量是根據它們的預測優(yōu)勢能力排序(通過卡方統(tǒng)計量和標準化測試版本進行測試)。這些相同的顏色用來描述整個細分的特定變量,為了更加容易的進行對比。
表2:貫穿5個子模型的變量
上圖對應譯為:
可以觀察發(fā)現5個子模型的變量相當相似,雖然變量的相關序列有些許不一樣。這意味著在整個細分里促使反應的因素是相似的。另外,如果考慮整個市場細分的特定變量的預測模式,可以觀察一些更有趣的。
表3描述了變量“過去12個月的購買數目”的預測模型。對于描述這樣的模式,證據權重正在發(fā)揮作用。
證據權重是普遍的測試方法,這是對于一個變量來說,用來了解值的特定范圍是否有集中度較高或者較低的預期目標。證據權重的正面值意味著有較高的集中度,反之亦然。
在這種情況下,對于購買次數相對高的值,將觀察到一個更高的證據權重。意味著受訪者有著相對更高的集中度。當創(chuàng)建一個線性模型時,在每個變量里,目標的平均值應該用來了解預測模式。
表格的外在檢查揭示了雖然在市場細分里,證據權重是不同的,但是趨勢是非常相似的。這意味著變量的預測模式在市場細分里是相似的。因此,變量在整個模型的影響不是有那么大差異的,對比市場細分帶來的明智的影響。
換句話而言,這意味著市場細分變量(年齡和收入)和預測變量“過去12個月的購買次數”。因此,市場細分不能令人們的獲得任何利益,即使提升了預測能力。
同樣注意到,在這個案例里,市場細分的變量信息值是相似的。就線性模型而言,部分判定系數可以使用而不是使用信息值。如果這是高度預測變量的情況,那么市場細分應該添加極限值去提高整個預測能力。
表3:在5個市場細分中,變量“過去12個月的購買次數”的預測模式
藍色:邏輯模型2-1:市場細分“年齡小于30”
紅色:邏輯模型2-2:市場細分“年齡介于30-48之間,且收入少于800K盧布”
綠色:邏輯模型2-3:市場細分“年齡介于30-48之間,且收入大于等于800k盧布”
紫色:邏輯模型2-4:市場細分“年齡大于48,收入少于100萬盧布”
藍色:邏輯模型2-5:市場細分“年齡大于48,收入大于等于100萬”
2、合適的方法
為了利用市場細分變量和預測變量之間的相互作用,設計市場細分的方案很重要,預測者和變量的預測模式在市場細分是不同的。
這將幫助人們創(chuàng)建方案,可以使市場細分的模型的預測能力高于整體模型的預測力量。
表4提高了一個可選的市場細分方案,來解決之前提到的問題。
表4:為創(chuàng)建邏輯模型進行市場細分模型-可選的方法
這種情況下,應該開發(fā)下面這些市場細分模型(子模型)
邏輯模型3-1:預測“過去12個月沒有購物”的市場細分反應
邏輯模型3-2:預測“過去12個月至少購物兩次”的市場細分反應
邏輯模型3-3:預測“過去12個月購物2次以上和沒有提交過產品評價”的市場細分反應
邏輯模型3-4:預測“過去12個月購物至少2次以上以及提交產品評價至少一次以上”的市場細分反應
子模型的變量已經在表5描述。作為之前提到的情況,常用變量已經用相同的顏色突出表示。可以觀察到在這樣的情況下,市場細分之間的變量重疊的范圍是非常有限的。因此,每個市場變量代表一個相同組的客戶,他們的反應驅動因素幾乎完全不同。
因此,在這樣情況下,模型的市場細分系統(tǒng)的基尼系數是明顯高于整體模型的基尼系數的。這個市場細分提供了具備明顯優(yōu)勢的預測力量,因為市場細分變量和預測變量的相互作為而產生。
表5:4個子模型的變量
表6:在5個市場細分里,變量“過去24個月購買次數”的預測模式
藍色:模型3-1過去12個月沒有購買記錄
紅色:模型3-2過去12個月至少兩次購買記錄
綠色:模型3-3過去12個月多于2次購買記錄,沒有提交產品評價
紫色:模型3-4過去12個月多于2次購買記錄,至少一次提交產品評價
在這樣的情況下,觀察到在市場細分中,特定變量的預測模式是具有明顯的不同的。表5的線更加分散,與表3相比看起來差別更加明顯,這意味著變量的預測模式在市場細分里是不同的。
因此,變量的影響在整個模型中,對比市場細分的明智的影響是相當不一樣的。換句話來說,這意味著,在市場細分變量和預測變量“過去18個月沒有不同的購買項目”之間有著顯著的相互作用。
因此,市場細分期望在預測能力中產生最佳提升。在這種情況下,它應該被標記,變量的信息值在市場變量中是不同的。
這又是另外一個有趣的方面。對于市場細分,考慮基于多棵樹的機器學習算法是好的。多重累計回歸樹,自由森林樹和增加隨機梯度這些技術可以使用眾多的樹和相同的整體進行預測。
如:如果考慮增加隨機梯度,在一個非常簡單的情況下(可能業(yè)余水平的情況下),包括建立一棵完整的樹,令第一棵樹的殘差作為第二棵樹的目標,依此計算下去直到發(fā)現預測能力得到進一步的提高。
在這樣的情況下,樹組成一些節(jié)點,確保它不會過度擬合數據?,F實中,這些樹希望能捕捉到相互之間的作用而不是和手頭的目標靠的太近??梢月撓氲綖榱税l(fā)展模型而進行的市場細分創(chuàng)建背后的哲理,其中市場細分的目標不是去實現更加接近目標的擬合,而是去確認相互作用的效果。
事實上,為了發(fā)展單獨的模型,確認市場細分的可能性方法包括考慮在樹的隨機梯度增加完整的情況下得到第一批樹的節(jié)點,考慮它們是否適合創(chuàng)建市場細分方法。
通過本文,我們學習了幾個方面:
1、當為了模型發(fā)展而執(zhí)行市場細分時,應該努力實現預測能力的提升,而不僅僅是為了追求目標的差異性。
2、市場細分捕捉相互作用的效果,因此預測者和預測模式是有一定的重要性的,他們在市場細分中發(fā)生改變。
3、創(chuàng)建市場細分的過程,包括發(fā)展每個市場細分的模型 ,以及投資已經從各子模型中選出來的變量。
4、在市場細分中,高度的預測變量的圖形化測試可以獲得有價值的洞察來。因此,這個過程要求對子模型進行迭代和詳細分析。只依賴CHAID或者CRT算法可能無法獲得合適的結果。必須記住,最初的目標是提高市場細分系統(tǒng)的預測能力。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數據分析師報考條件詳解與準備指南? ? 在數據驅動決策的時代浪潮下,CDA 數據分析師認證愈發(fā)受到矚目,成為眾多有志投身數 ...
2025-07-11數據透視表中兩列相乘合計的實用指南? 在數據分析的日常工作中,數據透視表憑借其強大的數據匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數據分析師:連接數據與業(yè)務的價值轉化者? ? 在大數據與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數據查詢到趨勢預判? ? 在數據驅動決策的時代,預測分析作為挖掘數據潛在價值的核心手段,正被廣泛 ...
2025-07-10數據查詢結束后:分析師的收尾工作與價值深化? ? 在數據分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數 ...
2025-07-10CDA 數據分析師考試:從報考到取證的全攻略? 在數字經濟蓬勃發(fā)展的今天,數據分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數據背后的時間軌跡? 在數據分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數據類型:時間維度的精準切片? ? 在數據的世界里,時間是最不可或缺的維度之一,而year_month數據類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數據分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數據分析師認證考試中,Python 作為數據處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數據趨勢與突變分析的有力工具? ? ? 在數據分析的廣袤領域中,準確捕捉數據的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數據分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數據分析師認證作為國內權威的數據分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網絡(LSTM)作為循環(huán)神經網絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數據中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數 ...
2025-07-07CDA數據分析師證書考試全攻略? 在數字化浪潮席卷全球的當下,數據已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數據分析師也因此成為 ...
2025-07-07剖析 CDA 數據分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數據分析師考試作為衡量數據專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數據處理的關鍵技能? 在數據處理與分析工作中,數據格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數據分析師視角:從數據迷霧中探尋商業(yè)真相? 在數字化浪潮席卷全球的今天,數據已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數據分析師:開啟數據職業(yè)發(fā)展新征程? ? 在數據成為核心生產要素的今天,數據分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03