
一個(gè)靠譜的數(shù)據(jù)分析師是怎樣煉成的
近些年,互聯(lián)網(wǎng)公司對(duì)數(shù)據(jù)分析師崗位的需求越來(lái)越多,這不是偶然。
過(guò)去十多年,中國(guó)互聯(lián)網(wǎng)行業(yè)靠著人口紅利和流量紅利野蠻生長(zhǎng);而隨著流量獲取成本不斷提高、運(yùn)營(yíng)效率的不斷下降,這種粗放的經(jīng)營(yíng)模式已經(jīng)不再可行。互聯(lián)網(wǎng)企業(yè)迫切需要通過(guò)數(shù)據(jù)分析來(lái)實(shí)現(xiàn)精細(xì)化運(yùn)營(yíng),降低成本、提高效率;而這對(duì)數(shù)據(jù)分析師也提出了更高的要求。
本文將和大家分享數(shù)據(jù)分析師的演變、數(shù)據(jù)分析價(jià)值體系、數(shù)據(jù)分析師必備的四大能力、七大常用思路以及實(shí)戰(zhàn)分析案例。
一、數(shù)據(jù)分析師的前世今生
在介紹數(shù)據(jù)分析師之前,我們先來(lái)看一下這幾個(gè)歷史人物,看看他們都跟數(shù)據(jù)分析師有著怎樣的淵源?
歷史上大名鼎鼎的“分析師”
上面展示的六個(gè)歷史人物(從左往右,從上往下)分別是:張良、管仲、蕭何、孫斌、鬼谷子和諸葛亮。他們是歷史上大名鼎鼎的謀士,有的還做過(guò)丞相。他們博覽群書(shū)、眼光獨(dú)到,通過(guò)對(duì)大量史實(shí)進(jìn)行總結(jié)發(fā)現(xiàn)了很多規(guī)律,并且在實(shí)踐中成功預(yù)測(cè)了很多事件。他們通過(guò) “歷史統(tǒng)計(jì)——總結(jié)分析——預(yù)測(cè)未來(lái)”的實(shí)踐為自己的組織創(chuàng)造了絕大的價(jià)值,而這就是“數(shù)據(jù)分析師”的前身。
那么現(xiàn)在,數(shù)據(jù)分析師需要哪些必備技能,如何成為一名優(yōu)秀的數(shù)據(jù)分析師呢?
二、數(shù)據(jù)分析師的價(jià)值金字塔
一個(gè)完整的企業(yè)數(shù)據(jù)分析體系涉及到多個(gè)環(huán)節(jié):采集、清理、轉(zhuǎn)化、存儲(chǔ)、可視化、分析決策等等。其中,不同環(huán)節(jié)工作內(nèi)容不一樣,消耗的時(shí)間和產(chǎn)生的價(jià)值也相差甚遠(yuǎn)。
數(shù)據(jù)分析師的價(jià)值金字塔
互聯(lián)網(wǎng)企業(yè)數(shù)據(jù)分析體系中至少有三方面的數(shù)據(jù):用戶行為數(shù)據(jù)、交易訂單數(shù)據(jù)和CRM數(shù)據(jù)。工程師把不同來(lái)源的數(shù)據(jù)采集好,然后通過(guò)清理、轉(zhuǎn)化等環(huán)節(jié)統(tǒng)一到數(shù)據(jù)平臺(tái)上;再由專(zhuān)門(mén)的數(shù)據(jù)工程師從數(shù)據(jù)平臺(tái)上提出數(shù)據(jù)。這些工作占用了整個(gè)環(huán)節(jié)90%的時(shí)間,然而產(chǎn)生的價(jià)值卻只占10%。
這個(gè)金字塔再往上數(shù)據(jù)分析就和業(yè)務(wù)實(shí)際緊密結(jié)合,以報(bào)表、可視化等方式支持企業(yè)的業(yè)務(wù)決策,涵蓋產(chǎn)品、運(yùn)營(yíng)、市場(chǎng)、銷(xiāo)售、客戶支持各個(gè)一線部門(mén)。這個(gè)部分占用了整個(gè)環(huán)節(jié)才10%的時(shí)間,但是卻能產(chǎn)生90%的價(jià)值。
一個(gè)優(yōu)秀的商務(wù)數(shù)據(jù)分析師應(yīng)該以價(jià)值為導(dǎo)向,緊密結(jié)合產(chǎn)品、運(yùn)營(yíng)、銷(xiāo)售、客戶支持等實(shí)踐,支持各條業(yè)務(wù)線發(fā)現(xiàn)問(wèn)題、解決問(wèn)題并創(chuàng)造更多的價(jià)值。
三、數(shù)據(jù)分析師必備的四大能力
1.全局觀
某日,產(chǎn)品經(jīng)理跑過(guò)來(lái)問(wèn)我:Hi, 能不能幫我看一下昨天產(chǎn)品新功能發(fā)送的數(shù)據(jù)?謝謝!條件反射我會(huì)說(shuō):好,我馬上給你!不過(guò)我還是禮貌性地問(wèn)了一句:為什么需要這數(shù)據(jù)呢?產(chǎn)品經(jīng)理回復(fù)道:哦,昨天新功能上線了,我想看看效果。知道了產(chǎn)品經(jīng)理的目的,我就可以針對(duì)性地進(jìn)行數(shù)據(jù)提取和分析,分析的結(jié)果和建議也就更加具有可操作性。
很多時(shí)候,數(shù)據(jù)分析師不能就數(shù)說(shuō)數(shù),陷入各種報(bào)表中不能自拔。一個(gè)優(yōu)秀的數(shù)據(jù)分析師應(yīng)該具有全局觀,碰到分析需求的時(shí)候退一步多問(wèn)個(gè)為什么,更好地了解問(wèn)題背景和分析目標(biāo)。
2.專(zhuān)業(yè)度
某企業(yè)的數(shù)據(jù)科學(xué)家針對(duì)用戶流失情形進(jìn)行建模預(yù)測(cè),最終得到的用戶流失模型預(yù)測(cè)準(zhǔn)確率高達(dá)90%多。準(zhǔn)確率如此之高,讓商務(wù)分析師都不敢相信。經(jīng)過(guò)檢驗(yàn),發(fā)現(xiàn)數(shù)據(jù)科學(xué)家的模型中有一個(gè)自變量是 “用戶是否點(diǎn)擊取消按鈕” 。而點(diǎn)擊了“取消”按鈕是用戶流失的重要征兆,做過(guò)這個(gè)動(dòng)作的用戶基本上都會(huì)流失,用這個(gè)自變量來(lái)預(yù)測(cè)流失沒(méi)有任何業(yè)務(wù)意義和可操作性。
數(shù)據(jù)分析師要在所在行業(yè)(例如電商、O2O、社交、媒體、SaaS、互金等等)展示她/他的專(zhuān)業(yè)度,熟悉自己行業(yè)的業(yè)務(wù)流程和數(shù)據(jù)背后的意義,避免上面的數(shù)據(jù)笑話。
3.想象力
商業(yè)環(huán)境的變化越來(lái)越快、越來(lái)越復(fù)雜,一組商業(yè)數(shù)據(jù)的背后涉及到的影響因素是常人難以想象的。數(shù)據(jù)分析師應(yīng)該在工作經(jīng)驗(yàn)的基礎(chǔ)上發(fā)揮想象力,大膽創(chuàng)新和假設(shè)。
根據(jù)硅谷公司的核心KPI(Facebook的4-2-2準(zhǔn)則,LinkedIn的connection規(guī)律),我們也想找到互聯(lián)網(wǎng)企業(yè)驅(qū)動(dòng)增長(zhǎng)最核心的KPI?;谖覀兊南胂罅汀睙o(wú)埋點(diǎn)”全量數(shù)據(jù)采集的優(yōu)勢(shì), 我們創(chuàng)造了” GrowingIO留存魔法師” 。通過(guò)全量采集的數(shù)據(jù),智能自動(dòng)的后端計(jì)算,以及簡(jiǎn)單的使用交互,留存魔法師可以幫助企業(yè)迅速找到與其留存最相關(guān)的用戶行為,就像魔法師輕輕揮動(dòng)魔法棒一樣簡(jiǎn)單。例如某 SaaS產(chǎn)品 ,在一周內(nèi)創(chuàng)建過(guò)3個(gè)圖表的用戶(群)留存率非常高,那么”一周+3個(gè)+圖表”就是我們驅(qū)動(dòng)用戶增長(zhǎng)的魔法數(shù)字。
4.信任度
以銷(xiāo)售崗位為例,一個(gè)銷(xiāo)售人員首先要和用戶建立起信任;如果用戶不信任你的話,那他也很難信任或者購(gòu)買(mǎi)你的產(chǎn)品。同理,數(shù)據(jù)分析師要和各部門(mén)同事建立良好的人際關(guān)系,形成一定的信任。各個(gè)部門(mén)的同事信任你了,他們才可能更容易接受你的分析結(jié)論和建議;否則事倍功半。
四、數(shù)據(jù)分析常見(jiàn)的七種思路
1.簡(jiǎn)單趨勢(shì)
通過(guò)實(shí)時(shí)訪問(wèn)趨勢(shì)了解產(chǎn)品使用情況,便于產(chǎn)品迅速迭代。訪問(wèn)用戶量、訪問(wèn)來(lái)源、訪問(wèn)用戶行為三大指標(biāo)對(duì)于趨勢(shì)分析具有重要意義。
分鐘級(jí)的實(shí)時(shí)走勢(shì)分析
以星期為周期的趨勢(shì)對(duì)比
2.多維分解
數(shù)據(jù)分析師可以根據(jù)分析需要,從多維度對(duì)指標(biāo)進(jìn)行分解。例如瀏覽器類(lèi)型、操作系統(tǒng)類(lèi)型、訪問(wèn)來(lái)源、廣告來(lái)源、地區(qū)、網(wǎng)站/手機(jī)應(yīng)用、設(shè)備品牌、APP版本等等維度。
多維度分析訪問(wèn)用戶的屬性
3.轉(zhuǎn)化漏斗
按照已知的轉(zhuǎn)化路徑,借助漏斗模型分析總體和每一步的轉(zhuǎn)化情況。常見(jiàn)的轉(zhuǎn)化情境有注冊(cè)轉(zhuǎn)化分析、購(gòu)買(mǎi)轉(zhuǎn)化分析等。
漏斗分析展示注冊(cè)每一步的流失率
4.用戶分群
在精細(xì)化分析中,常常需要對(duì)有某個(gè)特定行為的用戶群組進(jìn)行分析和比對(duì);數(shù)據(jù)分析師需要將多維度和多指標(biāo)作為分群條件,有針對(duì)性地優(yōu)化產(chǎn)品,提升用戶體驗(yàn)。
5.細(xì)查路徑
數(shù)據(jù)分析師可以觀察用戶的行為軌跡,探索用戶與產(chǎn)品的交互過(guò)程;進(jìn)而從中發(fā)現(xiàn)問(wèn)題、激發(fā)靈感亦或驗(yàn)證假設(shè)。
通過(guò)細(xì)查路徑分析用戶的行為規(guī)律
6.留存分析
留存分析是探索用戶行為與回訪之間的關(guān)聯(lián)。一般我們講的留存率,是指“新增用戶”在一段時(shí)間內(nèi)“回訪網(wǎng)站/app”的比例。 數(shù)據(jù)分析師通過(guò)分析不同用戶群組的留存差異、使用過(guò)不同功能用戶的留存差異來(lái)找到產(chǎn)品的增長(zhǎng)點(diǎn)。
留存分析發(fā)現(xiàn)“創(chuàng)建圖表”的用戶留存度更高
7.A/B 測(cè)試
A/B測(cè)試就是同時(shí)進(jìn)行多個(gè)方案并行測(cè)試,但是每個(gè)方案僅有一個(gè)變量不同;然后以某種規(guī)則(例如用戶體驗(yàn)、數(shù)據(jù)指標(biāo)等)優(yōu)勝略汰選擇最優(yōu)的方案。數(shù)據(jù)分析師需要在這個(gè)過(guò)程中選擇合理的分組樣本、監(jiān)測(cè)數(shù)據(jù)指標(biāo)、事后數(shù)據(jù)分析和不同方案評(píng)估。
五、數(shù)據(jù)分析實(shí)戰(zhàn)案例
某社交平臺(tái)推出付費(fèi)高級(jí)功能,并且以EDM(Email Direct Marketing,電子郵件營(yíng)銷(xiāo))的形式向目標(biāo)用戶推送,用戶可以直接點(diǎn)擊郵件中的鏈接完成注冊(cè)。該渠道的注冊(cè)轉(zhuǎn)化率一直在10%-20%之間;但是8月下旬開(kāi)始注冊(cè)轉(zhuǎn)化率急劇下降,甚至不到5%。
如果你是該公司的數(shù)據(jù)分析師,你會(huì)如何分析這個(gè)問(wèn)題呢?換言之,哪些因素可能造成EDM轉(zhuǎn)化率驟降?
一個(gè)優(yōu)秀的數(shù)據(jù)分析師應(yīng)該具有全局觀和專(zhuān)業(yè)度,從業(yè)務(wù)實(shí)際出發(fā),綜合各個(gè)方面的可能性。因此,EDM注冊(cè)轉(zhuǎn)化率驟降的可能性羅列如下:
1.技術(shù)原因:ETL延遲或者故障,造成前端注冊(cè)數(shù)據(jù)缺失,注冊(cè)轉(zhuǎn)化率急劇下降;
2.外部因素:該時(shí)間節(jié)點(diǎn)是否有節(jié)假日,其他部門(mén)近期是否有向用戶發(fā)送推廣郵件,這些因素可能稀釋用戶的注意力;
3.內(nèi)部因素:郵件的文案、設(shè)計(jì)是否有改變;郵件的到達(dá)率、打開(kāi)率、點(diǎn)擊率是否正常;郵件的注冊(cè)流是否順暢。
經(jīng)過(guò)逐一排查,數(shù)據(jù)分析師將原因鎖定在注冊(cè)流程上:產(chǎn)品經(jīng)理在注冊(cè)環(huán)節(jié)添加了綁定信用卡的內(nèi)容,導(dǎo)致用戶的注冊(cè)提交意愿大幅度下降,轉(zhuǎn)化率暴跌。
一個(gè)看似簡(jiǎn)單的轉(zhuǎn)化率分析問(wèn)題,它的背后是數(shù)據(jù)分析師各方面能力的體現(xiàn)。首先是技術(shù)層面,對(duì)ETL(數(shù)據(jù)抽取-轉(zhuǎn)換-載入)的理解和認(rèn)識(shí);其實(shí)是全局觀,對(duì)季節(jié)性、公司等層面的業(yè)務(wù)有清晰的了解;最后是專(zhuān)業(yè)度,對(duì)EDM業(yè)務(wù)的流程、設(shè)計(jì)等了如指掌。
練就數(shù)據(jù)分析的洪荒之力并非一朝一夕之功,而是在實(shí)踐中不斷成長(zhǎng)和升華。一個(gè)優(yōu)秀的數(shù)據(jù)分析師應(yīng)該以價(jià)值為導(dǎo)向,放眼全局、立足業(yè)務(wù)、與人為善,用數(shù)據(jù)來(lái)驅(qū)動(dòng)增長(zhǎng)。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱(chēng) BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專(zhuān)注于從單 ...
2025-07-09year_month數(shù)據(jù)類(lèi)型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類(lèi)型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專(zhuān)業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03