
近些年,互聯(lián)網(wǎng)公司對(duì)數(shù)據(jù)分析師崗位的需求越來越多,這不是偶然。
過去十多年,中國(guó)互聯(lián)網(wǎng)行業(yè)靠著人口紅利和流量紅利野蠻生長(zhǎng);而隨著流量獲取成本不斷提高、運(yùn)營(yíng)效率的不斷下降,這種粗放的經(jīng)營(yíng)模式已經(jīng)不再可行。互聯(lián)網(wǎng)企業(yè)迫切需要通過數(shù)據(jù)分析來實(shí)現(xiàn)精細(xì)化運(yùn)營(yíng),降低成本、提高效率;而這對(duì)數(shù)據(jù)分析師也提出了更高的要求。
本文將和大家分享數(shù)據(jù)分析師的演變、數(shù)據(jù)分析價(jià)值體系、數(shù)據(jù)分析師必備的四大能力、七大常用思路以及實(shí)戰(zhàn)分析案例。
一、數(shù)據(jù)分析師的前世今生
在介紹數(shù)據(jù)分析師之前,我們先來看一下這幾個(gè)歷史人物,看看他們都跟數(shù)據(jù)分析師有著怎樣的淵源?
六個(gè)歷史人物(從左往右,從上往下)分別是:張良、管仲、蕭何、孫斌、鬼谷子和諸葛亮。他們是歷史上大名鼎鼎的謀士,有的還做過丞相。他們博覽群書、眼光獨(dú)到,通過對(duì)大量史實(shí)進(jìn)行總結(jié)發(fā)現(xiàn)了很多規(guī)律,并且在實(shí)踐中成功預(yù)測(cè)了很多事件。他們通過「歷史統(tǒng)計(jì)——總結(jié)分析——預(yù)測(cè)未來」的實(shí)踐為自己的組織創(chuàng)造了絕大的價(jià)值,而這就是「數(shù)據(jù)分析師」的前身。
那么現(xiàn)在,數(shù)據(jù)分析師需要哪些必備技能,如何成為一名優(yōu)秀的數(shù)據(jù)分析師呢?
二、數(shù)據(jù)分析師的價(jià)值金字塔
一個(gè)完整的企業(yè)數(shù)據(jù)分析體系涉及到多個(gè)環(huán)節(jié):采集、清理、轉(zhuǎn)化、存儲(chǔ)、可視化、分析決策等等。其中,不同環(huán)節(jié)工作內(nèi)容不一樣,消耗的時(shí)間和產(chǎn)生的價(jià)值也相差甚遠(yuǎn)。
互聯(lián)網(wǎng)企業(yè)數(shù)據(jù)分析體系中至少有三方面的數(shù)據(jù):用戶行為數(shù)據(jù)、交易訂單數(shù)據(jù)和 CRM 數(shù)據(jù)。工程師把不同來源的數(shù)據(jù)采集好,然后通過清理、轉(zhuǎn)化等環(huán)節(jié)統(tǒng)一到數(shù)據(jù)平臺(tái)上;再由專門的數(shù)據(jù)工程師從數(shù)據(jù)平臺(tái)上提出數(shù)據(jù)。這些工作占用了整個(gè)環(huán)節(jié) 90% 的時(shí)間,然而產(chǎn)生的價(jià)值卻只占 10%。
這個(gè)金字塔再往上數(shù)據(jù)分析就和業(yè)務(wù)實(shí)際緊密結(jié)合,以報(bào)表、可視化等方式支持企業(yè)的業(yè)務(wù)決策,涵蓋產(chǎn)品、運(yùn)營(yíng)、市場(chǎng)、銷售、客戶支持各個(gè)一線部門。這個(gè)部分占用了整個(gè)環(huán)節(jié)才 10% 的時(shí)間,但是卻能產(chǎn)生 90% 的價(jià)值。
一個(gè)優(yōu)秀的商務(wù)數(shù)據(jù)分析師應(yīng)該以價(jià)值為導(dǎo)向,緊密結(jié)合產(chǎn)品、運(yùn)營(yíng)、銷售、客戶支持等實(shí)踐,支持各條業(yè)務(wù)線發(fā)現(xiàn)問題、解決問題并創(chuàng)造更多的價(jià)值。
三、數(shù)據(jù)分析師必備的四大能力
1. 全局觀
某日,產(chǎn)品經(jīng)理跑過來問我:Hi, 能不能幫我看一下昨天產(chǎn)品新功能發(fā)送的數(shù)據(jù)?謝謝!條件反射我會(huì)說:好,我馬上給你!不過我還是禮貌性地問了一句:為什么需要這數(shù)據(jù)呢?產(chǎn)品經(jīng)理回復(fù)道:哦,昨天新功能上線了,我想看看效果。知道了產(chǎn)品經(jīng)理的目的,我就可以針對(duì)性地進(jìn)行數(shù)據(jù)提取和分析,分析的結(jié)果和建議也就更加具有可操作性。
很多時(shí)候,數(shù)據(jù)分析師不能就數(shù)說數(shù),陷入各種報(bào)表中不能自拔。一個(gè)優(yōu)秀的數(shù)據(jù)分析師應(yīng)該具有全局觀,碰到分析需求的時(shí)候退一步多問個(gè)為什么,更好地了解問題背景和分析目標(biāo)。
2. 專業(yè)度
某企業(yè)的數(shù)據(jù)科學(xué)家針對(duì)用戶流失情形進(jìn)行建模預(yù)測(cè),最終得到的用戶流失模型預(yù)測(cè)準(zhǔn)確率高達(dá) 90% 多。準(zhǔn)確率如此之高,讓商務(wù)分析師都不敢相信。經(jīng)過檢驗(yàn),發(fā)現(xiàn)數(shù)據(jù)科學(xué)家的模型中有一個(gè)自變量是「用戶是否點(diǎn)擊取消按鈕」。而點(diǎn)擊了「取消」按鈕是用戶流失的重要征兆,做過這個(gè)動(dòng)作的用戶基本上都會(huì)流失,用這個(gè)自變量來預(yù)測(cè)流失沒有任何業(yè)務(wù)意義和可操作性。
數(shù)據(jù)分析師要在所在行業(yè)(例如電商、O2O、社交、媒體、SaaS、互金等等)展示她/他的專業(yè)度,熟悉自己行業(yè)的業(yè)務(wù)流程和數(shù)據(jù)背后的意義,避免上面的數(shù)據(jù)笑話。
3. 想象力
商業(yè)環(huán)境的變化越來越快、越來越復(fù)雜,一組商業(yè)數(shù)據(jù)的背后涉及到的影響因素是常人難以想象的。數(shù)據(jù)分析師應(yīng)該在工作經(jīng)驗(yàn)的基礎(chǔ)上發(fā)揮想象力,大膽創(chuàng)新和假設(shè)。
根據(jù)硅谷公司的核心 KPI(Facebook 的 4-2-2 準(zhǔn)則,LinkedIn 的 connection 規(guī)律),我們也想找到互聯(lián)網(wǎng)企業(yè)驅(qū)動(dòng)增長(zhǎng)最核心的 KPI。基于我們的想象力和「無埋點(diǎn)」全量數(shù)據(jù)采集的優(yōu)勢(shì),我們創(chuàng)造了」GrowingIO 留存魔法師」。通過全量采集的數(shù)據(jù),智能自動(dòng)的后端計(jì)算,以及簡(jiǎn)單的使用交互,留存魔法師可以幫助企業(yè)迅速找到與其留存最相關(guān)的用戶行為,就像魔法師輕輕揮動(dòng)魔法棒一樣簡(jiǎn)單。例如某 SaaS 產(chǎn)品,在一周內(nèi)創(chuàng)建過 3 個(gè)圖表的用戶(群)留存率非常高,那么「一周+3 個(gè)+圖表」就是我們驅(qū)動(dòng)用戶增長(zhǎng)的魔法數(shù)字。
4. 信任度
以銷售崗位為例,一個(gè)銷售人員首先要和用戶建立起信任;如果用戶不信任你的話,那他也很難信任或者購(gòu)買你的產(chǎn)品。同理,數(shù)據(jù)分析師要和各部門同事建立良好的人際關(guān)系,形成一定的信任。各個(gè)部門的同事信任你了,他們才可能更容易接受你的分析結(jié)論和建議;否則事倍功半。
四、數(shù)據(jù)分析常見的七種思路
1. 簡(jiǎn)單趨勢(shì)
通過實(shí)時(shí)訪問趨勢(shì)了解產(chǎn)品使用情況,便于產(chǎn)品迅速迭代。訪問用戶量、訪問來源、訪問用戶行為三大指標(biāo)對(duì)于趨勢(shì)分析具有重要意義。
2. 多維分解
數(shù)據(jù)分析師可以根據(jù)分析需要,從多維度對(duì)指標(biāo)進(jìn)行分解。例如瀏覽器類型、操作系統(tǒng)類型、訪問來源、廣告來源、地區(qū)、網(wǎng)站/手機(jī)應(yīng)用、設(shè)備品牌、app 版本等等維度。
3. 轉(zhuǎn)化漏斗
按照已知的轉(zhuǎn)化路徑,借助漏斗模型分析總體和每一步的轉(zhuǎn)化情況。常見的轉(zhuǎn)化情境有注冊(cè)轉(zhuǎn)化分析、購(gòu)買轉(zhuǎn)化分析等。
4. 用戶分群
在精細(xì)化分析中,常常需要對(duì)有某個(gè)特定行為的用戶群組進(jìn)行分析和比對(duì);數(shù)據(jù)分析師需要將多維度和多指標(biāo)作為分群條件,有針對(duì)性地優(yōu)化產(chǎn)品,提升用戶體驗(yàn)。
5. 細(xì)查路徑
數(shù)據(jù)分析師可以觀察用戶的行為軌跡,探索用戶與產(chǎn)品的交互過程;進(jìn)而從中發(fā)現(xiàn)問題、激發(fā)靈感亦或驗(yàn)證假設(shè)。
6. 留存分析
留存分析是探索用戶行為與回訪之間的關(guān)聯(lián)。一般我們講的留存率,是指「新增用戶」在一段時(shí)間內(nèi)「回訪網(wǎng)站/app」的比例。數(shù)據(jù)分析師通過分析不同用戶群組的留存差異、使用過不同功能用戶的留存差異來找到產(chǎn)品的增長(zhǎng)點(diǎn)。
A/B 測(cè)試就是同時(shí)進(jìn)行多個(gè)方案并行測(cè)試,但是每個(gè)方案僅有一個(gè)變量不同;然后以某種規(guī)則(例如用戶體驗(yàn)、數(shù)據(jù)指標(biāo)等)優(yōu)勝略汰選擇最優(yōu)的方案。數(shù)據(jù)分析師需要在這個(gè)過程中選擇合理的分組樣本、監(jiān)測(cè)數(shù)據(jù)指標(biāo)、事后數(shù)據(jù)分析和不同方案評(píng)估。
五、數(shù)據(jù)分析實(shí)戰(zhàn)案例
某社交平臺(tái)推出付費(fèi)高級(jí)功能,并且以 EDM(Email Direct Marketing,電子郵件營(yíng)銷)的形式向目標(biāo)用戶推送,用戶可以直接點(diǎn)擊郵件中的鏈接完成注冊(cè)。該渠道的注冊(cè)轉(zhuǎn)化率一直在 10%-20% 之間;但是 8 月下旬開始注冊(cè)轉(zhuǎn)化率急劇下降,甚至不到 5%。
如果你是該公司的數(shù)據(jù)分析師,你會(huì)如何分析這個(gè)問題呢?換言之,哪些因素可能造成 EDM 轉(zhuǎn)化率驟降?
一個(gè)優(yōu)秀的數(shù)據(jù)分析師應(yīng)該具有全局觀和專業(yè)度,從業(yè)務(wù)實(shí)際出發(fā),綜合各個(gè)方面的可能性。因此,EDM 注冊(cè)轉(zhuǎn)化率驟降的可能性羅列如下:
1. 技術(shù)原因:ETL 延遲或者故障,造成前端注冊(cè)數(shù)據(jù)缺失,注冊(cè)轉(zhuǎn)化率急劇下降;
2. 外部因素:該時(shí)間節(jié)點(diǎn)是否有節(jié)假日,其他部門近期是否有向用戶發(fā)送推廣郵件,這些因素可能稀釋用戶的注意力;
3. 內(nèi)部因素:郵件的文案、設(shè)計(jì)是否有改變;郵件的到達(dá)率、打開率、點(diǎn)擊率是否正常;郵件的注冊(cè)流是否順暢。
經(jīng)過逐一排查,數(shù)據(jù)分析師將原因鎖定在注冊(cè)流程上:產(chǎn)品經(jīng)理在注冊(cè)環(huán)節(jié)添加了綁定信用卡的內(nèi)容,導(dǎo)致用戶的注冊(cè)提交意愿大幅度下降,轉(zhuǎn)化率暴跌。
一個(gè)看似簡(jiǎn)單的轉(zhuǎn)化率分析問題,它的背后是數(shù)據(jù)分析師各方面能力的體現(xiàn)。首先是技術(shù)層面,對(duì) ETL(數(shù)據(jù)抽取-轉(zhuǎn)換-載入)的理解和認(rèn)識(shí);其實(shí)是全局觀,對(duì)季節(jié)性、公司等層面的業(yè)務(wù)有清晰的了解;最后是專業(yè)度,對(duì) EDM 業(yè)務(wù)的流程、設(shè)計(jì)等了如指掌。
練就數(shù)據(jù)分析的洪荒之力并非一朝一夕之功,而是在實(shí)踐中不斷成長(zhǎng)和升華。一個(gè)優(yōu)秀的數(shù)據(jù)分析師應(yīng)該以價(jià)值為導(dǎo)向,放眼全局、立足業(yè)務(wù)、與人為善,用數(shù)據(jù)來驅(qū)動(dòng)增長(zhǎng)。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10