
數(shù)據(jù)分析方法之?dāng)?shù)據(jù)分類
分類與對比一樣,是人類認(rèn)知事物的基本方法。人類在征服大自然的過程中,先通過各種對比來認(rèn)知事物,然后把事物之間的差異和相似之處進(jìn)行總結(jié),給相似的一類事物貼上一個標(biāo)簽,例如將不動的但會慢慢生長的事物叫作“植物”,將會動的事物叫作“動物”;吃肉的動物對于人類是“危險的”,吃草的動物對人類的威脅不大,是“安全的”。其實(shí)這就是一種分類的方法。
分類是由“分”和“類”組成的,其本質(zhì)就是把事物分開,歸到不同的類別中并分別識別,從而獲得對事物的重新認(rèn)知。如果我們把客戶分成不同的類別,就可以更仔細(xì)地識別客戶。如果將客戶按照大小來分類,就有了大客戶、中客戶和小客戶,這樣我們對“客戶”這個研究對象就有了更加深刻的認(rèn)知,對所擁有的客戶結(jié)構(gòu)也有了更加深入的了解。例如我們總共有300個客戶,如果將其分成10個大客戶、30個中客戶、60個小客戶、200個微客戶,那么客戶從一個整體變成了由4種客戶組成的結(jié)構(gòu)化組合,如下圖所示。
漢字分4大類:象形字、會意字、指事字、形聲字。“分”就是會意字,拆開看是由“八”和“刀”組成的,本質(zhì)就是將事物一個切成八刀。在日常生活中,最簡單和最基本的拆分事物的方法就是一分為二,筆者把它叫作“一體兩面”。
舉一個例子,“事情”一詞可分為“事”與“情”,做事情肯定與人有關(guān),中國人講關(guān)系、講人情,所以做事情的時候一定包括“事”與“情”兩個方面,即做事情和溝通感情。我們要成就一件事情,就要把握兩個方面:“事”要做好,“情”也要做好。
數(shù)據(jù)分析師大多是工科出身,喜歡鉆研技術(shù)、算法,卻不善于溝通,在“事”方面做得再厲害,也只是在“事情”的一方面上做得很好,但也要在“情”上做得很好。在公司工作時,能否與人深入溝通,能否讓更多的人了解你為什么這樣做、這樣做有什么好處、帶來什么價值,能否讓別人心甘情愿地聽你的,這些都是關(guān)于“情”的方面,也是關(guān)于“人”的方面。
因?yàn)椤扒椤倍际歉擞嘘P(guān)系的,所以可以將“事情”拆成“事”和“人”。用重要性來評價這兩個維度就會形成一個矩陣——“人事矩陣”。這個矩陣可分為4個象限。我們在評價一件事情時,要看“事”和“人”對我們的重要程度。如果“事”重要,“人”也重要,處理時需要有雙贏的結(jié)果,可以采用雙贏策略;如果“人”很重要,而“事”不重要,則為了讓對方高興,讓對方贏,可以采用妥協(xié)的策略;如果“事”很重要,而“人”不重要,則可以采取競爭策略;如果“事”不重要,“人”也不重要,則可以采取放棄的策略,如下圖所示。
例如在生活中,夫妻之間為了一些事情吵架,因?yàn)榉蚱奘且^一輩子的,所以“人”很重要,“事”就不那么重要了,你所采取的策略就只能是雙贏和妥協(xié)。但是雙贏策略容易導(dǎo)致競爭,過多注重“事”的重要性就會進(jìn)入競爭環(huán)節(jié),把吵架升上到打架,就是把“事”看得太重要了,把“人”看得不重要了。
在公司里也是同樣的道理。在公司里人際關(guān)系是很重要的,但是做事也很重要,公司是一個做事的環(huán)境,所以在公司里要盡可能采取雙贏的策略;如果人不太重要,像與協(xié)作方、供應(yīng)商等都是商業(yè)關(guān)系,關(guān)系不是那么緊密,一般采取競爭策略;但是如果一家公司歷史悠久,人員關(guān)系穩(wěn)定,同事關(guān)系超過10年以上,則會很容易弱化事情的重要性,強(qiáng)調(diào)人與人關(guān)系的重要性,把人看得過于重要,最后只能采取妥協(xié)的策略,如下圖所示。所以,越是歷史悠久的企業(yè),變革管理越難。
下面再介紹一個矩陣——GE矩陣。在做產(chǎn)品或者業(yè)務(wù)分析時,可以通過產(chǎn)品的未來發(fā)展?jié)摿?或行業(yè)吸引力)和現(xiàn)在的市場占有率這兩個維度對產(chǎn)品進(jìn)行描述。
麥肯錫在給GE做咨詢的時候發(fā)現(xiàn)波士頓矩陣有一定的局限性,因此增加了市場吸引力指標(biāo),包括業(yè)務(wù)未來發(fā)展前景如何、競爭水平如何、發(fā)展速度如何、客戶資源狀況如何等,由此形成了GE矩陣。GE矩陣有更多的維度來評價市場吸引力和業(yè)務(wù)競爭力。GE矩陣在本質(zhì)上是把業(yè)務(wù)分為兩個維度來描述形成的矩陣,我們稱其為矩陣分析法。
把一個事物分為兩個方面,能夠更全面地觀察事物的變化情況。在分類時必須要有標(biāo)準(zhǔn),也就是分類的維度或者看問題的視角。例如把事情從人的重要性和事的重要性兩個方面來看,就形成了“人事矩陣”;在處理大量事情的時候,把事情從重要性和緊急性兩個方面來看,就形成了時間管理矩陣,如下圖所示。
重要且緊急的事情要首先處理;重要但不緊急的事情可以按計劃來處理,但千萬不能等到事情變得緊急的時候再處理;緊急但不重要的事情可以授權(quán)給下屬或者其他人去處理;不重要也不緊急的事情,或者沒有必要去做的事情,能推掉就推掉吧。
“分”一定要有維度,可以按單維度分,例如新客戶和老客戶是按時間進(jìn)行分類,大客戶和小客戶是按客戶的規(guī)模進(jìn)行分類。按客戶的規(guī)模分類也有不同的分類方式,可以按客戶對公司的貢獻(xiàn)來分,對公司貢獻(xiàn)大的叫大客戶,貢獻(xiàn)小的叫小客戶;
也可以按客戶自身的規(guī)模來分,雖然GE、阿里巴巴只在你的店里買了一個小圖釘,但是其也算大客戶,因?yàn)楣疽?guī)模很大。這兩種分法是完全不同的,雖然都是按規(guī)模來分,關(guān)鍵在于用什么“規(guī)?!敝笜?biāo)來分,用客戶自身的規(guī)模來分,則是站在客戶的角度;按客戶對公司的貢獻(xiàn)來分,則是站在公司的角度。RFM模型是三維度分析方法(見下圖),用來從企業(yè)的角度去分析客戶,其三個維度分別為:R——時間進(jìn)度,代表客戶的活躍度或者流失風(fēng)險;F——購買次數(shù),代表客戶的忠誠度;M——購買的金額,代表客戶的購買量或金額貢獻(xiàn)。這三個維度是從企業(yè)管理客戶的角度來分的,不是從客戶自身特征的角度來分的,所以RFM模型不能看作是客戶分類的模型。一個購買量大的客戶,不見得其自身就是“大客戶”,而一個企業(yè)規(guī)模大的客戶,可能其購買的數(shù)量和金額都很小。
RFM模型用來指導(dǎo)企業(yè)內(nèi)部的客戶管理。針對不同的客戶,企業(yè)需要采取不同的策略。F和M值都很高的客戶,但R值變大了,說明客戶處在休眠期,需要對客戶采取激活策略;當(dāng)R值很小,F(xiàn)值很高,但M值很小,說明這是一個少量多次購買的小型忠誠客戶,企業(yè)除了要維護(hù)他們的利益,還需要采取一定的措施增加他們每次的購買金額,減少購買次數(shù)。因?yàn)橘徺I次數(shù)在整個企業(yè)中是“成本中心”,客戶每次購買都需要專門的人員進(jìn)行跟蹤、服務(wù),這就導(dǎo)致企業(yè)的服務(wù)成本很高,所以可以引導(dǎo)客戶提高每次的購買金額。RFM模型本質(zhì)上是客戶經(jīng)理們的績效評價模型以及管理客戶的工具,而不是對客戶進(jìn)行描述的模型。
在對客戶進(jìn)行分類時,可以從各種維度去分析客戶,將維度兩兩組合都可以進(jìn)行矩陣分析。
下面以一個建筑企業(yè)采購水泥為例,從其自身的成長性和與我們的合作關(guān)系角度對其進(jìn)行分析。有一家建筑企業(yè)從我們這里采購多少水泥,從其他供應(yīng)商處采購多少水泥,我們在這家企業(yè)供應(yīng)商中的排名如何,代表著我們與這家建筑企業(yè)的客戶關(guān)系緊密程度。雖然這家企業(yè)的銷售額可能每年沒有太多的增長,但是每年從我們這里采購的水泥數(shù)量都在增長,即從其他供應(yīng)商處削減了采購量,在我們這里增加了采購量,所以從我們的角度來衡量,此客戶是增長型客戶??蛻粼谖覀冞@里采購額的增長并不代表客戶的銷售額在增長,也不代表客戶對我們的忠誠度或者依賴度在增加。所以,我們在進(jìn)行數(shù)據(jù)分析的時候,要清楚數(shù)據(jù)所代表的本質(zhì)含義,不能把一個數(shù)據(jù)的含義給放大了。如果在RFM模型中客戶的M值高就認(rèn)為它是大客戶,這是錯的;如果客戶在我們這里的采購額增加就認(rèn)為它是增長型客戶,這也是錯的。這是筆者在講解數(shù)據(jù)分析的時候特別強(qiáng)調(diào)的觀點(diǎn)——基于數(shù)據(jù),不要放大數(shù)據(jù)的內(nèi)涵和外延。數(shù)據(jù)的觀測點(diǎn)非常重要,是站在自己的角度還是站在客戶的角度來分析,結(jié)論是不同的。
分類的標(biāo)準(zhǔn)就是分類的維度,一個分類維度叫作單維度,兩個分類維度叫作矩陣,三個分類維度就形成了魔方,例如RFM模型就是三個維度的魔方。多維度可以用雷達(dá)圖、扇形圖或其他圖形來表示,例如衡量市場競爭要素常用的模型——八爪魚模型就是從八個維度來分析產(chǎn)品的市場競爭力的。
分類是一個非常強(qiáng)大的工具,沒有分類,我們對事物的認(rèn)識就只能停留在表面。例如,企業(yè)要對產(chǎn)品的銷售額進(jìn)行分析,可以從兩個不同的視角來看,一個是不同業(yè)務(wù)的組成,另一個是不同區(qū)域的組成,可以通過這兩個維度來了解企業(yè)的產(chǎn)品組成狀況,如下圖所示。
在分類的時候可以有很多自己的創(chuàng)意。早在2004年,筆者作為萬科“千億元目標(biāo)戰(zhàn)略項(xiàng)目”的項(xiàng)目組長,幫助萬科做了一個客戶細(xì)分。當(dāng)時我們向美國的房地產(chǎn)公司老大——普爾特房屋公司學(xué)習(xí)。普爾特在對客戶分類時有一種特殊的維度——家庭生命周期,其將客戶分為單身家庭、丁克家庭、有小孩的家庭、有成年孩子的家庭和空巢家庭,家庭在不同階段就會有不同的住房需求。2004年,當(dāng)時中國人的理念還是一個家庭一輩子就買一套房子,但是我們進(jìn)行一個大膽的假設(shè):未來中國的家庭也會根據(jù)不同的家庭階段換不同的房子,并且這會成為常態(tài),因此,我們把萬科的客戶細(xì)分加入一個新的維度——用戶家庭生命周期,如下圖所示。
這種分類看似很簡單,但要找到這個“分”的維度,需要對事物、對商業(yè)有充分且深刻的理解。
對于現(xiàn)有的互聯(lián)網(wǎng)公司,可以從業(yè)務(wù)的角度對其進(jìn)行分類,例如阿里巴巴是平臺型電商公司,京東是物流型電商公司,百度是搜索引擎型公司,騰訊是通信社交型公司,網(wǎng)易是游戲型公司,新浪是媒體型公司……這些是從各個公司主營或者最大的業(yè)務(wù)模塊來分類的。我們也可以從互聯(lián)網(wǎng)發(fā)展的歷程來看不同業(yè)務(wù)的發(fā)展?jié)摿?,互?lián)網(wǎng)從一個媒體型工具(互聯(lián)網(wǎng)媒體、新聞、搜索、信息傳播),逐步發(fā)展成內(nèi)容傳播平臺(微博、博客等)再發(fā)展成社交平臺(微信、臉書、推特等),目前,互聯(lián)網(wǎng)開始在傳統(tǒng)行業(yè)中普及應(yīng)用,并有了新的創(chuàng)新應(yīng)用領(lǐng)域,發(fā)展成了資源整合平臺(O2O服務(wù)、共享經(jīng)濟(jì)、微商等)。這些都是一個技術(shù)在發(fā)展階段上的應(yīng)用創(chuàng)新所帶來的時代變化,這些也影響著不同業(yè)務(wù)的商業(yè)價值,越緊跟時代的技術(shù)價值越高,所以媒體型的新浪只有30億美元左右的市值,游戲平臺型的網(wǎng)易則有接近200億
美元左右的市值,而電商平臺型的阿里巴巴和社交平臺型的騰訊則有接近2000億美元的市值,如下圖所示。
分類是一種基本的分析方法,但這里面深藏著對事物本質(zhì)的理解。如果你把互聯(lián)網(wǎng)看成媒體,那么你就是傳統(tǒng)的互聯(lián)網(wǎng)門戶網(wǎng)站(網(wǎng)易、搜狐、新浪)。而隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)已經(jīng)不僅僅是媒體,不僅僅是門戶網(wǎng)站,而是具有了更多的能量。如果你把互聯(lián)網(wǎng)看作一個平臺,那么你就是阿里巴巴和騰訊,這兩家企業(yè)都在做平臺,一個做交易平臺,一個做溝通平臺。那么未來的互聯(lián)網(wǎng)會是什么?
這個很難回答,就如同在1999年時,極少人能夠知道在互聯(lián)網(wǎng)中可以做出滴滴打車、Facebook、微信、Uber等產(chǎn)品。當(dāng)然不排除猜對的人,但目前的共識是:互聯(lián)網(wǎng)正在與傳統(tǒng)行業(yè)深度融合并發(fā)生化學(xué)變化,引導(dǎo)著傳統(tǒng)行業(yè)重構(gòu)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10