
數(shù)據(jù)分析方法之?dāng)?shù)據(jù)分類
分類與對比一樣,是人類認知事物的基本方法。人類在征服大自然的過程中,先通過各種對比來認知事物,然后把事物之間的差異和相似之處進行總結(jié),給相似的一類事物貼上一個標(biāo)簽,例如將不動的但會慢慢生長的事物叫作“植物”,將會動的事物叫作“動物”;吃肉的動物對于人類是“危險的”,吃草的動物對人類的威脅不大,是“安全的”。其實這就是一種分類的方法。
分類是由“分”和“類”組成的,其本質(zhì)就是把事物分開,歸到不同的類別中并分別識別,從而獲得對事物的重新認知。如果我們把客戶分成不同的類別,就可以更仔細地識別客戶。如果將客戶按照大小來分類,就有了大客戶、中客戶和小客戶,這樣我們對“客戶”這個研究對象就有了更加深刻的認知,對所擁有的客戶結(jié)構(gòu)也有了更加深入的了解。例如我們總共有300個客戶,如果將其分成10個大客戶、30個中客戶、60個小客戶、200個微客戶,那么客戶從一個整體變成了由4種客戶組成的結(jié)構(gòu)化組合,如下圖所示。
漢字分4大類:象形字、會意字、指事字、形聲字?!胺帧本褪菚庾郑痖_看是由“八”和“刀”組成的,本質(zhì)就是將事物一個切成八刀。在日常生活中,最簡單和最基本的拆分事物的方法就是一分為二,筆者把它叫作“一體兩面”。
舉一個例子,“事情”一詞可分為“事”與“情”,做事情肯定與人有關(guān),中國人講關(guān)系、講人情,所以做事情的時候一定包括“事”與“情”兩個方面,即做事情和溝通感情。我們要成就一件事情,就要把握兩個方面:“事”要做好,“情”也要做好。
數(shù)據(jù)分析師大多是工科出身,喜歡鉆研技術(shù)、算法,卻不善于溝通,在“事”方面做得再厲害,也只是在“事情”的一方面上做得很好,但也要在“情”上做得很好。在公司工作時,能否與人深入溝通,能否讓更多的人了解你為什么這樣做、這樣做有什么好處、帶來什么價值,能否讓別人心甘情愿地聽你的,這些都是關(guān)于“情”的方面,也是關(guān)于“人”的方面。
因為“情”都是跟人有關(guān)系的,所以可以將“事情”拆成“事”和“人”。用重要性來評價這兩個維度就會形成一個矩陣——“人事矩陣”。這個矩陣可分為4個象限。我們在評價一件事情時,要看“事”和“人”對我們的重要程度。如果“事”重要,“人”也重要,處理時需要有雙贏的結(jié)果,可以采用雙贏策略;如果“人”很重要,而“事”不重要,則為了讓對方高興,讓對方贏,可以采用妥協(xié)的策略;如果“事”很重要,而“人”不重要,則可以采取競爭策略;如果“事”不重要,“人”也不重要,則可以采取放棄的策略,如下圖所示。
例如在生活中,夫妻之間為了一些事情吵架,因為夫妻是要過一輩子的,所以“人”很重要,“事”就不那么重要了,你所采取的策略就只能是雙贏和妥協(xié)。但是雙贏策略容易導(dǎo)致競爭,過多注重“事”的重要性就會進入競爭環(huán)節(jié),把吵架升上到打架,就是把“事”看得太重要了,把“人”看得不重要了。
在公司里也是同樣的道理。在公司里人際關(guān)系是很重要的,但是做事也很重要,公司是一個做事的環(huán)境,所以在公司里要盡可能采取雙贏的策略;如果人不太重要,像與協(xié)作方、供應(yīng)商等都是商業(yè)關(guān)系,關(guān)系不是那么緊密,一般采取競爭策略;但是如果一家公司歷史悠久,人員關(guān)系穩(wěn)定,同事關(guān)系超過10年以上,則會很容易弱化事情的重要性,強調(diào)人與人關(guān)系的重要性,把人看得過于重要,最后只能采取妥協(xié)的策略,如下圖所示。所以,越是歷史悠久的企業(yè),變革管理越難。
下面再介紹一個矩陣——GE矩陣。在做產(chǎn)品或者業(yè)務(wù)分析時,可以通過產(chǎn)品的未來發(fā)展?jié)摿?或行業(yè)吸引力)和現(xiàn)在的市場占有率這兩個維度對產(chǎn)品進行描述。
麥肯錫在給GE做咨詢的時候發(fā)現(xiàn)波士頓矩陣有一定的局限性,因此增加了市場吸引力指標(biāo),包括業(yè)務(wù)未來發(fā)展前景如何、競爭水平如何、發(fā)展速度如何、客戶資源狀況如何等,由此形成了GE矩陣。GE矩陣有更多的維度來評價市場吸引力和業(yè)務(wù)競爭力。GE矩陣在本質(zhì)上是把業(yè)務(wù)分為兩個維度來描述形成的矩陣,我們稱其為矩陣分析法。
把一個事物分為兩個方面,能夠更全面地觀察事物的變化情況。在分類時必須要有標(biāo)準(zhǔn),也就是分類的維度或者看問題的視角。例如把事情從人的重要性和事的重要性兩個方面來看,就形成了“人事矩陣”;在處理大量事情的時候,把事情從重要性和緊急性兩個方面來看,就形成了時間管理矩陣,如下圖所示。
重要且緊急的事情要首先處理;重要但不緊急的事情可以按計劃來處理,但千萬不能等到事情變得緊急的時候再處理;緊急但不重要的事情可以授權(quán)給下屬或者其他人去處理;不重要也不緊急的事情,或者沒有必要去做的事情,能推掉就推掉吧。
“分”一定要有維度,可以按單維度分,例如新客戶和老客戶是按時間進行分類,大客戶和小客戶是按客戶的規(guī)模進行分類。按客戶的規(guī)模分類也有不同的分類方式,可以按客戶對公司的貢獻來分,對公司貢獻大的叫大客戶,貢獻小的叫小客戶;
也可以按客戶自身的規(guī)模來分,雖然GE、阿里巴巴只在你的店里買了一個小圖釘,但是其也算大客戶,因為公司規(guī)模很大。這兩種分法是完全不同的,雖然都是按規(guī)模來分,關(guān)鍵在于用什么“規(guī)?!敝笜?biāo)來分,用客戶自身的規(guī)模來分,則是站在客戶的角度;按客戶對公司的貢獻來分,則是站在公司的角度。RFM模型是三維度分析方法(見下圖),用來從企業(yè)的角度去分析客戶,其三個維度分別為:R——時間進度,代表客戶的活躍度或者流失風(fēng)險;F——購買次數(shù),代表客戶的忠誠度;M——購買的金額,代表客戶的購買量或金額貢獻。這三個維度是從企業(yè)管理客戶的角度來分的,不是從客戶自身特征的角度來分的,所以RFM模型不能看作是客戶分類的模型。一個購買量大的客戶,不見得其自身就是“大客戶”,而一個企業(yè)規(guī)模大的客戶,可能其購買的數(shù)量和金額都很小。
RFM模型用來指導(dǎo)企業(yè)內(nèi)部的客戶管理。針對不同的客戶,企業(yè)需要采取不同的策略。F和M值都很高的客戶,但R值變大了,說明客戶處在休眠期,需要對客戶采取激活策略;當(dāng)R值很小,F(xiàn)值很高,但M值很小,說明這是一個少量多次購買的小型忠誠客戶,企業(yè)除了要維護他們的利益,還需要采取一定的措施增加他們每次的購買金額,減少購買次數(shù)。因為購買次數(shù)在整個企業(yè)中是“成本中心”,客戶每次購買都需要專門的人員進行跟蹤、服務(wù),這就導(dǎo)致企業(yè)的服務(wù)成本很高,所以可以引導(dǎo)客戶提高每次的購買金額。RFM模型本質(zhì)上是客戶經(jīng)理們的績效評價模型以及管理客戶的工具,而不是對客戶進行描述的模型。
在對客戶進行分類時,可以從各種維度去分析客戶,將維度兩兩組合都可以進行矩陣分析。
下面以一個建筑企業(yè)采購水泥為例,從其自身的成長性和與我們的合作關(guān)系角度對其進行分析。有一家建筑企業(yè)從我們這里采購多少水泥,從其他供應(yīng)商處采購多少水泥,我們在這家企業(yè)供應(yīng)商中的排名如何,代表著我們與這家建筑企業(yè)的客戶關(guān)系緊密程度。雖然這家企業(yè)的銷售額可能每年沒有太多的增長,但是每年從我們這里采購的水泥數(shù)量都在增長,即從其他供應(yīng)商處削減了采購量,在我們這里增加了采購量,所以從我們的角度來衡量,此客戶是增長型客戶??蛻粼谖覀冞@里采購額的增長并不代表客戶的銷售額在增長,也不代表客戶對我們的忠誠度或者依賴度在增加。所以,我們在進行數(shù)據(jù)分析的時候,要清楚數(shù)據(jù)所代表的本質(zhì)含義,不能把一個數(shù)據(jù)的含義給放大了。如果在RFM模型中客戶的M值高就認為它是大客戶,這是錯的;如果客戶在我們這里的采購額增加就認為它是增長型客戶,這也是錯的。這是筆者在講解數(shù)據(jù)分析的時候特別強調(diào)的觀點——基于數(shù)據(jù),不要放大數(shù)據(jù)的內(nèi)涵和外延。數(shù)據(jù)的觀測點非常重要,是站在自己的角度還是站在客戶的角度來分析,結(jié)論是不同的。
分類的標(biāo)準(zhǔn)就是分類的維度,一個分類維度叫作單維度,兩個分類維度叫作矩陣,三個分類維度就形成了魔方,例如RFM模型就是三個維度的魔方。多維度可以用雷達圖、扇形圖或其他圖形來表示,例如衡量市場競爭要素常用的模型——八爪魚模型就是從八個維度來分析產(chǎn)品的市場競爭力的。
分類是一個非常強大的工具,沒有分類,我們對事物的認識就只能停留在表面。例如,企業(yè)要對產(chǎn)品的銷售額進行分析,可以從兩個不同的視角來看,一個是不同業(yè)務(wù)的組成,另一個是不同區(qū)域的組成,可以通過這兩個維度來了解企業(yè)的產(chǎn)品組成狀況,如下圖所示。
在分類的時候可以有很多自己的創(chuàng)意。早在2004年,筆者作為萬科“千億元目標(biāo)戰(zhàn)略項目”的項目組長,幫助萬科做了一個客戶細分。當(dāng)時我們向美國的房地產(chǎn)公司老大——普爾特房屋公司學(xué)習(xí)。普爾特在對客戶分類時有一種特殊的維度——家庭生命周期,其將客戶分為單身家庭、丁克家庭、有小孩的家庭、有成年孩子的家庭和空巢家庭,家庭在不同階段就會有不同的住房需求。2004年,當(dāng)時中國人的理念還是一個家庭一輩子就買一套房子,但是我們進行一個大膽的假設(shè):未來中國的家庭也會根據(jù)不同的家庭階段換不同的房子,并且這會成為常態(tài),因此,我們把萬科的客戶細分加入一個新的維度——用戶家庭生命周期,如下圖所示。
這種分類看似很簡單,但要找到這個“分”的維度,需要對事物、對商業(yè)有充分且深刻的理解。
對于現(xiàn)有的互聯(lián)網(wǎng)公司,可以從業(yè)務(wù)的角度對其進行分類,例如阿里巴巴是平臺型電商公司,京東是物流型電商公司,百度是搜索引擎型公司,騰訊是通信社交型公司,網(wǎng)易是游戲型公司,新浪是媒體型公司……這些是從各個公司主營或者最大的業(yè)務(wù)模塊來分類的。我們也可以從互聯(lián)網(wǎng)發(fā)展的歷程來看不同業(yè)務(wù)的發(fā)展?jié)摿Γヂ?lián)網(wǎng)從一個媒體型工具(互聯(lián)網(wǎng)媒體、新聞、搜索、信息傳播),逐步發(fā)展成內(nèi)容傳播平臺(微博、博客等)再發(fā)展成社交平臺(微信、臉書、推特等),目前,互聯(lián)網(wǎng)開始在傳統(tǒng)行業(yè)中普及應(yīng)用,并有了新的創(chuàng)新應(yīng)用領(lǐng)域,發(fā)展成了資源整合平臺(O2O服務(wù)、共享經(jīng)濟、微商等)。這些都是一個技術(shù)在發(fā)展階段上的應(yīng)用創(chuàng)新所帶來的時代變化,這些也影響著不同業(yè)務(wù)的商業(yè)價值,越緊跟時代的技術(shù)價值越高,所以媒體型的新浪只有30億美元左右的市值,游戲平臺型的網(wǎng)易則有接近200億
美元左右的市值,而電商平臺型的阿里巴巴和社交平臺型的騰訊則有接近2000億美元的市值,如下圖所示。
分類是一種基本的分析方法,但這里面深藏著對事物本質(zhì)的理解。如果你把互聯(lián)網(wǎng)看成媒體,那么你就是傳統(tǒng)的互聯(lián)網(wǎng)門戶網(wǎng)站(網(wǎng)易、搜狐、新浪)。而隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)已經(jīng)不僅僅是媒體,不僅僅是門戶網(wǎng)站,而是具有了更多的能量。如果你把互聯(lián)網(wǎng)看作一個平臺,那么你就是阿里巴巴和騰訊,這兩家企業(yè)都在做平臺,一個做交易平臺,一個做溝通平臺。那么未來的互聯(lián)網(wǎng)會是什么?
這個很難回答,就如同在1999年時,極少人能夠知道在互聯(lián)網(wǎng)中可以做出滴滴打車、Facebook、微信、Uber等產(chǎn)品。當(dāng)然不排除猜對的人,但目前的共識是:互聯(lián)網(wǎng)正在與傳統(tǒng)行業(yè)深度融合并發(fā)生化學(xué)變化,引導(dǎo)著傳統(tǒng)行業(yè)重構(gòu)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03