
從本質(zhì)上看,幾乎所有工作都和數(shù)據(jù)有關(guān)系,都或多或少需要一些數(shù)據(jù)分析方法。但數(shù)據(jù)本身是有門檻的,很多人上學的時候就怕數(shù)學課,更不要說復雜的理論了。因此,所謂基礎數(shù)據(jù)分析方法,應該是:
總之,人人能用的,才是基礎方法。
基于這個理念,我們?yōu)榇蠹艺砹司欧N基礎分析方法,簡單又好用。
最基礎的分析方法,可以從一個指標開始,這就是“周期性分析法”。
所謂“周期性分析法”,操作上非常簡單,就是把一個指標的觀察時間拉長,看它是否有周期變化規(guī)律。
這種方法分析簡單,但是非常實用。因為新手經(jīng)常因為不懂看周期變化,引發(fā)笑話。諸如:
很多時候,我們看的指標是總體指標,而總體指標是由若干部分組成的,比如:
因此看到一個總體指標以后,可以根據(jù)它的組成部分,對總體做拆解,了解各部分組成,是為結(jié)構(gòu)分析法(分析總體的內(nèi)部結(jié)構(gòu))。
結(jié)構(gòu)分析法在很多時候都好用,比如問:“為什么業(yè)績下滑呀!”答:“因為XX區(qū)域沒有做好!”通過看結(jié)構(gòu),能很快找到責任人。
除了單純地看結(jié)構(gòu),人們也喜歡做排名,區(qū)分個高中低,這就是分層分析法。
很多同學會把分層和結(jié)構(gòu)搞混,大家只要記得以下兩句:
這三種方法,是基礎中的基礎。一來,它們都是在分析一個指標,二來,它們都是基于事實陳述,不需要啥計算。當我們初到一個公司,初接觸一個新數(shù)據(jù),都可以用這三種方法,建立基礎認知。
矩陣分析法的最大優(yōu)勢,在于:直觀易懂??梢院苋菀讖膬蓚€指標的交叉對比中發(fā)現(xiàn)問題。特別是當這兩個指標是投入/成本指標的時候,成本高+收入低,成本低+收入與高兩個類別,能直接為業(yè)務指示出改進方向,因此極大避免了:“不知道如何評價好壞”的問題。
很多咨詢公司都喜歡用這種方法,類似KANO模型或者波士頓矩陣,本質(zhì)就是找到了兩個很好的評價指標,通過兩指標交叉構(gòu)造矩陣,對業(yè)務分類。分類的區(qū)分效果很好,就廣為流傳了。
當分析指標變得更多的時候,最重要的工作,就是弄清楚:到底這些指標是什么關(guān)系。典型的關(guān)系有兩種。
幾個指標相互獨立,且是上一級指標的組成部分。比如我們常說的:業(yè)績=客戶數(shù)*消費率*客單價
在這個公式里:
此時,客戶數(shù)、消費率、客單價就是并列的三個指標,并且都是業(yè)績的子指標。
幾個指標相互關(guān)聯(lián),有前后順序關(guān)系。比如我們常說的:新注冊用戶數(shù)=廣告瀏覽人數(shù)*落地頁轉(zhuǎn)化率*注冊頁轉(zhuǎn)化率。
此時,廣告頁、落地頁、注冊頁的指標相互關(guān)聯(lián),用戶要一步步走。
這兩種關(guān)系,分別對應兩種基礎分析方法:
指標拆解法,一般在經(jīng)營分析中使用較多。舉個簡單的例子,一個小程序商城,上月銷售業(yè)績150萬,本月120萬。如果只看結(jié)果,除了少了30萬以外啥也不知道。但是進行指標拆解以后,就能發(fā)現(xiàn)很多東西(如下圖)
拆解以后可以明顯看出:本月雖然注冊用戶人數(shù)增加了,但是消費率大幅度降低,所以收入少了。后續(xù)可以進一步思考:如何提高消費率。
漏斗分析法,則在互聯(lián)網(wǎng)產(chǎn)品/推廣/運營分析中使用較多,因為互聯(lián)網(wǎng)產(chǎn)品能記錄較多用戶數(shù)據(jù),因此可以呈現(xiàn)整個用戶轉(zhuǎn)化流程,從而進行分析。
舉個簡單例子,在網(wǎng)上看到一個商品廣告,我們很感興趣,點擊進入購買。需要經(jīng)歷廣告頁→詳情頁→購物車→支付幾個步驟,每多一個步驟,就會有一些用戶流失,如同漏斗一樣。
此時可以用一個轉(zhuǎn)化漏斗,形象地表示這種關(guān)系(如下圖)。
有了轉(zhuǎn)化漏斗以后,就能進一步基于漏斗分析,從而指導業(yè)務改善:
當然,還有一些指標,可能不是直接的并行/串行關(guān)系,但是在工作中,也很想知道他們有沒有關(guān)系,比如:
此時,需要掌握相關(guān)分析法。注意:指標之間可能天生存在相關(guān)關(guān)系。常見的天生相關(guān),有三種形態(tài):
這三種情況,稱為:直接相關(guān)。直接相關(guān)不需要數(shù)據(jù)計算,通過指標梳理就能看清楚關(guān)系。相關(guān)分析法,更多是利用散點圖/相關(guān)系數(shù),找到潛在的相關(guān)關(guān)系(如下圖)。
但是要注意:相關(guān)不等于因果,到底如何解讀相關(guān)系數(shù),需要結(jié)合具體業(yè)務含義,不能胡亂下結(jié)論哦。
以上所有方法,都是基于數(shù)據(jù)指標計算,但實際業(yè)務中,很多關(guān)系并不能直接用數(shù)據(jù)指標表示。比如:
社區(qū)店/私域流量/刮風下雨,很難用一個數(shù)據(jù)指標來衡量。但這些因素,又確實會對企業(yè)經(jīng)營產(chǎn)生影響,該怎么分析呢?這就需要采用:標簽分析法。
舉個簡單的例子,南方某省,8月份經(jīng)常下暴雨。大家都覺得:下雨會影響門店業(yè)績。那么怎么分析呢?按照五步法,可以針對該省份門店,做分析如下圖:
那么可以得出結(jié)論:下雨對業(yè)績影響不大,這就做完了。
注意,上邊的小例子里,標簽做的很粗糙,只有簡單粗暴的下雨/沒下雨兩類。除了下雨以外,還可能有臺風、冰雹、高溫等等情況。因此,做標簽的精細程度,決定了標簽分析的準確度。而能否選取到合適的標簽,則考驗的是分析人員對業(yè)務的理解程度。
到這里,一共介紹了八種基礎方法。在實際工作中,一般都是多種方法綜合使用的。因為業(yè)務提的問題會很復雜,很有可能涉及多個指標、多個標簽。此時千頭萬緒,要理清思路,就得祭出第九種方法:MECE法。
MECE是(Mutually Exclusive Collectively Exhaustive)的縮寫,指的是“相互獨立,完全窮盡”的分類原則。通過MECE方法對問題進行分類,能做到清晰準確,從而容易找到答案。
MECE法是基礎分析和高級分析的分水嶺,也是從基礎提升到高級的通道。所有復雜的問題,都需要經(jīng)過認真的梳理和分解,才能成為一個個能解決的小問題。所謂的業(yè)務分析模型,其實就是對業(yè)務問題的MECE分解。
當然,肯定也有同學好奇:掌握了這九種方法以后,還可以怎么深入呢?一般有三條深入路線,可以進行深入分析。
業(yè)務模型,用來解決:定義模糊、數(shù)據(jù)貧瘠、需指導業(yè)務的問題。
比如業(yè)務在糾結(jié):
這些問題聽起來簡單,其實定義非常模糊,什么算好?怎么叫起作用?不發(fā)錢的激勵真的有用?各種問題錯綜復雜,且很有可能摻雜了業(yè)務部門自己的小心思。因此,需要細細的梳理業(yè)務邏輯,推導出可行的解題邏輯。
算法模型,用來解決:定義清晰、數(shù)據(jù)豐富、計算過程復雜的問題。
比如,高價值用戶識別問題,業(yè)務上已經(jīng)定義清楚了:
此時,可以用各種算法來建模了。建模的目的,不是為了增加分析深度,而是提高從分析到業(yè)務應用的效率。有了相對準確的模型判斷,業(yè)務可以通過CDP+MA,自動觸發(fā)營銷規(guī)則,不需要每次都寫ppt寫很久。算法模型需要一些
統(tǒng)計推斷方法,用來解決:定義清晰、沒有數(shù)據(jù)、需測試收集數(shù)據(jù)的問題。
比如:要上一個新版本產(chǎn)品,業(yè)務已經(jīng)定義了:新版本要提升用戶的人均在線時長(均值問題),現(xiàn)在要做測試,從兩個預備版本里選一個。此時要用:雙總體均值比較假設檢驗的方法。
當然,實際問題會更復雜,考慮各種控制變量、假設前提,還要考慮系統(tǒng)開發(fā)、數(shù)據(jù)采集方案,不單單靠分析師解決。
以上就是數(shù)據(jù)掌握了基礎方法以后,深入學習的三個路線。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10