
人群識別的常見錯誤,一種方法就可避免
一般說來,商家在進行決策時,尤其是在進行市場細分決策時,往往會看到這樣的描述:某高端女性護膚品牌A的目標消費群體是一二線城市,年齡在30-40歲間,高消費檔次的女性消費者(此處應有都市女金領配圖)。那么,具有以上屬性的目標消費者是如何從消費群體中被識別出來的?這些描述的背后,是經過數(shù)據(jù)分析得出的消費者洞察。而年齡、性別、地域、消費檔次、消費深度等便是用來區(qū)分消費者人群的常用屬性。為了達到更精準的消費者細分,就需要不同維度屬性的交叉分析,這個過程中往往會出現(xiàn)一些常見的錯誤,其實有一種方法就可以避免。
本期Data Knows就要告訴你如何利用數(shù)據(jù)分析來得出這些消費者洞察,并避免數(shù)據(jù)分析中的一些常見錯誤。
人群識別如此簡單?
Sooo Naive!---基數(shù)偏見,人群識別中的常見問題之一
深夜,上海市區(qū)某甲級寫字樓仍燈火通明,A品牌營銷同學小A看到數(shù)據(jù)分析師D仔拉出的A品牌“按消費者年齡層分布的線上銷售額柱狀圖”后,小A得出以下結論:A品牌最主要的消費群體應該是23-28歲的消費人群,然后是29-35歲消費人群。
其實,小A恰恰產生了數(shù)據(jù)分析中最易產生的偏見之一,基數(shù)偏見,即在不知道基數(shù)的情況下做出的判斷。此時D仔拍醒了沉浸在“人群識別如此簡單”幻想中的小A,給她亮出加入了低端護膚品牌B、所有護膚品,以及線上消費大盤后的柱狀圖:
小A立刻注意到,好像對于低端品牌B、所有的護膚品、乃至整個線上消費的大盤而言,主要的消費群體都是23-28歲人群,其次才是29-35歲人群。
難道所有護膚品牌商的目標客群都是23-35歲人群嗎?
正當小A面對屏幕陷入迷思之際,D仔在其身后幽幽說道:“其實,緣于23-35歲的年輕人群是線上消費人群中人數(shù)占比最多,因此,在大多數(shù)的類目消費中,23-35歲的人群均為占比最大的人群。不可否認,這群人是品牌最大的銷售額貢獻人群,但考慮到在人數(shù)眾多的23-35歲人群中找到目標消費者,如同大海撈針,而且并不能與其他品牌的消費目標人群產生區(qū)隔。因此,通過對比其他護膚品牌會有不一樣的發(fā)現(xiàn)。如上圖,加入了B品牌后,我們發(fā)現(xiàn)A品牌的36歲以上人群消費占比明顯高于B品牌及護膚品整體,所以正確的結論應該是36歲以上人群才是A品牌的目標消費群體。
在這里我要教你一種算法。迎著小A眼中的小星星,D仔在白板上寫下“TGI”三個字符。
換個算法,還你真相!
通過TGI算法識別結果:同樣的數(shù)據(jù),相反的結論!
“TGI代表著Target Group Index,直譯為目標人群指數(shù),也經常被稱為偏好度或重要性。一般常被用于統(tǒng)計中,用以判定特定群體的強勢或弱勢,算法多樣。而我們用來判別人群的TGI算法則被稱為人群TGI,人群TGI指數(shù)=目標群體中具有某一特征的群體所占比例/總體中具有相同特征的群體所占比例*標準數(shù)100。 ”D仔在白板上寫完公式后,回頭看著眼睛有些發(fā)直的小A接著說道:
“如果在這次案例中應用TGI算法,我們可以看出對于A品牌來說,36-50歲與50歲以上人群才是人群TGI指數(shù)最高的消費人群,換句話說,也是對A品牌最偏好的人群,而原定的23-35歲人群其實對于A品牌并不偏好。35歲以上人群的消費能力更強,客單價高,也更符合我們A品牌的高端定位,因此將這群人定為目標消費者才是最有效的營銷策略。同時對比我們的競品B品牌,人群TGI指數(shù)顯示18-28歲的青少年群體更偏好定位低端的B品牌,因此他們的目標消費者應該定為更年輕的人群。”
潛在客戶才最重要!
人群TGI指數(shù)-減法,找到更大的潛在偏好人群
D仔搖了搖沒什么反應的小A,接著說道:“其實還沒完呢,從這種人群TGI算法得出的結論應該是50歲以上人群才是最偏好我們A品牌的客戶,但其實我們最應該關注的是人群TGI指數(shù)第二高的36-50歲人群?!?
此時此刻,小A一臉懵......
D仔接著說道:“從數(shù)學原理判斷,50歲以上人群基數(shù)較小,占大盤4%,而36-50歲人群基數(shù)相對較大,占大盤17%,基數(shù)小的人群更容易在人群TGI計算中出現(xiàn)較大的偏好度,因此僅僅按照偏好度作為依據(jù),容易錯誤地把小基數(shù)群體作為目標人群,從而忽略更大的潛在偏好人群。為了克服這種偏見,我們可以采取減法的方式來計算人群TGI指數(shù),算法為人群TGI指數(shù)=目標群體中具有某一特征的群體所占比例-總體中具有相同特征的群體所占比例。緣于原數(shù)值能夠體現(xiàn)具體場景中的差異度,因此在減法TGI算法中無需標準化計算?!?
D仔說著又重新拉出一張柱狀圖,這次36-50歲人群成為了最偏好A品牌人群。小A恍然大悟道:“這次的結果我理解啦,就是36-50歲人群比起其他人群占整體銷售額5%的偏好度,而50歲以上人群有2%的偏好度,因此如果能抓住36歲以上人群,我們至少能抓住品牌總銷售額的7%!”
聽完后,D仔一臉鄙視:“額,簡單來說可以這么理解吧??傊?,TGI的使用也是有規(guī)則和前提的?!苯又珼仔在白板上寫下一行大字:人群TGI算法使用須知。寫完后D仔頭也不回的走出辦公室大門,深藏功與名,只留下小A一個人在空蕩蕩的辦公室,呆呆地看著黑板上的使用須知,二臉懵逼......
敲黑板劃重點時間!
人群TGI算法使用須知
人群TGI使用前提是擁有全量大盤數(shù)據(jù)作為參照;
人群TGI算法的大盤參照的選擇:在業(yè)務場景下,優(yōu)先使用大類目的大盤,例如A品牌使用護膚品消費大盤而非線上消費整體大盤,這樣便于理解基于特定類目消費的特殊性;
人群TGI算法中減法與除法的選擇:a) 除法:強調相對值差異,適用場景:各分組間占比差異較大,需突出占比小分組b) 減法:強調絕對值差異,適用場景:各分組間占比差異較小,需突出占比大分組
在決定目標消費人群的場景下,我們需突出占比大人群,因此需選擇減法;
除了人群TGI算法外還有品類TGI算法,用于判斷特定群體對于購物籃中各品類的偏好度,且聽下回分解。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到決策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10