
人群識別的常見錯誤,一種方法就可避免
一般說來,商家在進(jìn)行決策時,尤其是在進(jìn)行市場細(xì)分決策時,往往會看到這樣的描述:某高端女性護(hù)膚品牌A的目標(biāo)消費(fèi)群體是一二線城市,年齡在30-40歲間,高消費(fèi)檔次的女性消費(fèi)者(此處應(yīng)有都市女金領(lǐng)配圖)。那么,具有以上屬性的目標(biāo)消費(fèi)者是如何從消費(fèi)群體中被識別出來的?這些描述的背后,是經(jīng)過數(shù)據(jù)分析得出的消費(fèi)者洞察。而年齡、性別、地域、消費(fèi)檔次、消費(fèi)深度等便是用來區(qū)分消費(fèi)者人群的常用屬性。為了達(dá)到更精準(zhǔn)的消費(fèi)者細(xì)分,就需要不同維度屬性的交叉分析,這個過程中往往會出現(xiàn)一些常見的錯誤,其實有一種方法就可以避免。
本期Data Knows就要告訴你如何利用數(shù)據(jù)分析來得出這些消費(fèi)者洞察,并避免數(shù)據(jù)分析中的一些常見錯誤。
人群識別如此簡單?
Sooo Naive!---基數(shù)偏見,人群識別中的常見問題之一
深夜,上海市區(qū)某甲級寫字樓仍燈火通明,A品牌營銷同學(xué)小A看到數(shù)據(jù)分析師D仔拉出的A品牌“按消費(fèi)者年齡層分布的線上銷售額柱狀圖”后,小A得出以下結(jié)論:A品牌最主要的消費(fèi)群體應(yīng)該是23-28歲的消費(fèi)人群,然后是29-35歲消費(fèi)人群。
其實,小A恰恰產(chǎn)生了數(shù)據(jù)分析中最易產(chǎn)生的偏見之一,基數(shù)偏見,即在不知道基數(shù)的情況下做出的判斷。此時D仔拍醒了沉浸在“人群識別如此簡單”幻想中的小A,給她亮出加入了低端護(hù)膚品牌B、所有護(hù)膚品,以及線上消費(fèi)大盤后的柱狀圖:
小A立刻注意到,好像對于低端品牌B、所有的護(hù)膚品、乃至整個線上消費(fèi)的大盤而言,主要的消費(fèi)群體都是23-28歲人群,其次才是29-35歲人群。
難道所有護(hù)膚品牌商的目標(biāo)客群都是23-35歲人群嗎?
正當(dāng)小A面對屏幕陷入迷思之際,D仔在其身后幽幽說道:“其實,緣于23-35歲的年輕人群是線上消費(fèi)人群中人數(shù)占比最多,因此,在大多數(shù)的類目消費(fèi)中,23-35歲的人群均為占比最大的人群。不可否認(rèn),這群人是品牌最大的銷售額貢獻(xiàn)人群,但考慮到在人數(shù)眾多的23-35歲人群中找到目標(biāo)消費(fèi)者,如同大海撈針,而且并不能與其他品牌的消費(fèi)目標(biāo)人群產(chǎn)生區(qū)隔。因此,通過對比其他護(hù)膚品牌會有不一樣的發(fā)現(xiàn)。如上圖,加入了B品牌后,我們發(fā)現(xiàn)A品牌的36歲以上人群消費(fèi)占比明顯高于B品牌及護(hù)膚品整體,所以正確的結(jié)論應(yīng)該是36歲以上人群才是A品牌的目標(biāo)消費(fèi)群體。
在這里我要教你一種算法。迎著小A眼中的小星星,D仔在白板上寫下“TGI”三個字符。
換個算法,還你真相!
通過TGI算法識別結(jié)果:同樣的數(shù)據(jù),相反的結(jié)論!
“TGI代表著Target Group Index,直譯為目標(biāo)人群指數(shù),也經(jīng)常被稱為偏好度或重要性。一般常被用于統(tǒng)計中,用以判定特定群體的強(qiáng)勢或弱勢,算法多樣。而我們用來判別人群的TGI算法則被稱為人群TGI,人群TGI指數(shù)=目標(biāo)群體中具有某一特征的群體所占比例/總體中具有相同特征的群體所占比例*標(biāo)準(zhǔn)數(shù)100。 ”D仔在白板上寫完公式后,回頭看著眼睛有些發(fā)直的小A接著說道:
“如果在這次案例中應(yīng)用TGI算法,我們可以看出對于A品牌來說,36-50歲與50歲以上人群才是人群TGI指數(shù)最高的消費(fèi)人群,換句話說,也是對A品牌最偏好的人群,而原定的23-35歲人群其實對于A品牌并不偏好。35歲以上人群的消費(fèi)能力更強(qiáng),客單價高,也更符合我們A品牌的高端定位,因此將這群人定為目標(biāo)消費(fèi)者才是最有效的營銷策略。同時對比我們的競品B品牌,人群TGI指數(shù)顯示18-28歲的青少年群體更偏好定位低端的B品牌,因此他們的目標(biāo)消費(fèi)者應(yīng)該定為更年輕的人群。”
潛在客戶才最重要!
人群TGI指數(shù)-減法,找到更大的潛在偏好人群
D仔搖了搖沒什么反應(yīng)的小A,接著說道:“其實還沒完呢,從這種人群TGI算法得出的結(jié)論應(yīng)該是50歲以上人群才是最偏好我們A品牌的客戶,但其實我們最應(yīng)該關(guān)注的是人群TGI指數(shù)第二高的36-50歲人群?!?
此時此刻,小A一臉懵......
D仔接著說道:“從數(shù)學(xué)原理判斷,50歲以上人群基數(shù)較小,占大盤4%,而36-50歲人群基數(shù)相對較大,占大盤17%,基數(shù)小的人群更容易在人群TGI計算中出現(xiàn)較大的偏好度,因此僅僅按照偏好度作為依據(jù),容易錯誤地把小基數(shù)群體作為目標(biāo)人群,從而忽略更大的潛在偏好人群。為了克服這種偏見,我們可以采取減法的方式來計算人群TGI指數(shù),算法為人群TGI指數(shù)=目標(biāo)群體中具有某一特征的群體所占比例-總體中具有相同特征的群體所占比例。緣于原數(shù)值能夠體現(xiàn)具體場景中的差異度,因此在減法TGI算法中無需標(biāo)準(zhǔn)化計算?!?
D仔說著又重新拉出一張柱狀圖,這次36-50歲人群成為了最偏好A品牌人群。小A恍然大悟道:“這次的結(jié)果我理解啦,就是36-50歲人群比起其他人群占整體銷售額5%的偏好度,而50歲以上人群有2%的偏好度,因此如果能抓住36歲以上人群,我們至少能抓住品牌總銷售額的7%!”
聽完后,D仔一臉鄙視:“額,簡單來說可以這么理解吧??傊?,TGI的使用也是有規(guī)則和前提的?!苯又?,D仔在白板上寫下一行大字:人群TGI算法使用須知。寫完后D仔頭也不回的走出辦公室大門,深藏功與名,只留下小A一個人在空蕩蕩的辦公室,呆呆地看著黑板上的使用須知,二臉懵逼......
敲黑板劃重點(diǎn)時間!
人群TGI算法使用須知
人群TGI使用前提是擁有全量大盤數(shù)據(jù)作為參照;
人群TGI算法的大盤參照的選擇:在業(yè)務(wù)場景下,優(yōu)先使用大類目的大盤,例如A品牌使用護(hù)膚品消費(fèi)大盤而非線上消費(fèi)整體大盤,這樣便于理解基于特定類目消費(fèi)的特殊性;
人群TGI算法中減法與除法的選擇:a) 除法:強(qiáng)調(diào)相對值差異,適用場景:各分組間占比差異較大,需突出占比小分組b) 減法:強(qiáng)調(diào)絕對值差異,適用場景:各分組間占比差異較小,需突出占比大分組
在決定目標(biāo)消費(fèi)人群的場景下,我們需突出占比大人群,因此需選擇減法;
除了人群TGI算法外還有品類TGI算法,用于判斷特定群體對于購物籃中各品類的偏好度,且聽下回分解。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03