
數(shù)據(jù)分析的出路在哪里
數(shù)據(jù)分析的出路在哪里?類似問題出現(xiàn)在很多場景下:
有的是面試的時候被問到:你覺得這個職位長期發(fā)展的前景如何
有的是在各種群里的討論:Data Scientist 的出路在哪里?為什么做 Analytics 的活 title 卻是 Data Scientist?
有的是同事之間的交流:你接下來做啥?
問法不同,但討論的內容其實是類似的:數(shù)據(jù)分析 (Analytics) 有什么用?
我們先看一下數(shù)據(jù)分析的幾個階段:
第一階段:沒有數(shù)據(jù),更沒有分析
不管是產品也好,還是策略也好,憑的是從上到下的決定,靠的是經驗和感覺。
最后效果如何,沒有一個數(shù)據(jù)上的衡量標準,或者只有簡單粗暴的幾個數(shù)據(jù):有多少人用(購買),收入多少,成本多少,最后賺了多少。
第二階段:有數(shù)據(jù),看起來好像有分析
這個階段,數(shù)據(jù)多起來了,比如除了有多少人用,還有更多多維度的數(shù)據(jù),比如年齡、性別、地區(qū)等等,也有了更多層次的數(shù)據(jù),比如各種留存、拉新等方面。
分析方面則是有各種報表,看得眼花繚亂,很全面。
問題在于,這種情形下我們知道發(fā)生了什么,可能知道得還挺詳細,但是并不知道為什么會發(fā)生這些,以及接下來可能發(fā)生什么。
于是進入
第三階段:有數(shù)據(jù),有分析,有原因
這個階段開始引入 hypothesis 的概念,我們不但要知道發(fā)生了什么(reporting),還要知道為什么會發(fā)生 (hypothesis driven).
知道了為什么會發(fā)生,可以告訴我們以后做類似的事情,可能會發(fā)生什么。
可能是通過 correlation analysis,找到一些互相有關系的線索。
可能是通過 A/B test,找到因果性。
諸如此類。
而在這個階段做各種分析,A/B test 的時候,需要有 hypothesis-driven 的概念,而不能僅僅是:來,我們看下數(shù)據(jù)是什么樣子的。
比如 A/B test 能提供因果性,幫我們做決定是一方面 (launch product or not),更重要的是能幫助我們積累某一領域的知識,諸如提高 metrics A 可以提升留存;進一步, 我們可以知道提高 x% 的 A 可以提升 y% 的留存;再進一步,我們甚至還能搞清楚,對于不同的用戶、不同的階段,這個 x% -> y% 是不一樣的。
而這也是 analytics 的工作會掛著 Data Scientist 的 title.
Scientist 的定義并不是工作方法多么高大上,而在于其思緒方式:通過 hypothesis-driven,不但要知道發(fā)生了什么,還要知道為什么發(fā)生。
(當然另一方面也是因為 Data Scientsit 這個名字比較好聽了)
第四階段:知道發(fā)生了什么、知道為什么發(fā)生、知道接下來應該做什么
跟上一階段的區(qū)別在于,我們不但知道發(fā)生了什么 (reporting),知道為什么發(fā)生 (hypothesis-driven),還知道接下來應該做什么 (product/strategy leadership).
這個階段有很多難點:本身搞清楚應該做什么就很難,還需要把這些東西 sell 出去,就更是難上加難了,而這恰恰是數(shù)據(jù)分析的出路(之一)。
不管數(shù)據(jù)分析做出了什么結果,如果沒有把結論應用到實際 product change 里面去的話,都是垃圾。
知道發(fā)生了什么,比如 reporting,風險低回報低,因為不太能改變產品走向。
有些類型的數(shù)據(jù)分析,知道為什么發(fā)生,比如 A/B test,算是能改變產品走向,至少能決定 launch / no launch.
上面兩點對于大多數(shù)人來說又是必不可少的,除去工作本身會有需要以外,還有很重要的一點是通過這些事情來跟合作者打下互相信任的基礎,比如 product/engineering/design/UX research.
如果一上來就拋出數(shù)據(jù)分析的結論說咱們組接下來應該做 ABCD,要么他/她已經有了 track record,大家都很信任;要么其實產品組也不知道做什么,反正試試看唄。
所以大多數(shù)情況下,還是需要通過一些基本的項目打點基礎,讓 cross function team 覺得:哎不錯,這個人挺靠譜的,數(shù)據(jù)分析做出來的東西還是要信的。
接下來再慢慢提供產品的方向:我們接下來一個月應該試試做 A,可能會有預期的效果。
于是試了一下做 A,發(fā)現(xiàn)預期的效果沒錯,信任進一步建立。
于是再接下來:我們接下來半年應該試試做 B, C, D,其中 B 可能性比較大,但是回報也不會太大;C 風險比較大,但是如果成功的話回報也多;D 則是一個新的方向,做成做不成不知道,咱們試試看。成的話一起喝湯吃肉,不成的話再試試別的。
因為有了前面打下的互相信任的基礎,即使最后 C 和 D 都沒有做成,也不會被覺得是數(shù)據(jù)分析本身不夠 solid,瞎提供方向,而是這些項目本來就是有風險的。
當然了,如果沒有互相信任的基礎的話,很有可能大家也不會做 C 和 D,只會做 B.
而 B 的方向,很有可能本來就是打算做的,最后結果是數(shù)據(jù)分析提供了 support,而不是 lead.
對于大多數(shù)數(shù)據(jù)分析來說,階段二是基礎,階段三是應該做到的,階段四是好像能做到一些,但是還有很大提高余地的。
而數(shù)據(jù)分析的出路和影響力,就來源于四。
這也是為什么很多數(shù)據(jù)分析的職位看起來要求很低:第四階段做得如何,實在是太難量化了。
從某個角度來說,數(shù)據(jù)分析跟算命是類似的:先告訴你人生過去的幾十年發(fā)生了什么,你一對比發(fā)現(xiàn)說得還真不錯 (reporting);然后說你當下是不是有什么憂慮,在擔心什么 (hypothesis driven);再說你要解決這些問題,需要做 ABCD ( product leadership).
算命先生想要產生 impact,就需要把 reporting 做得準,hypothesis 搞得清楚,這樣客戶才能相信,接下來才能忽悠。
當然,數(shù)據(jù)分析做的事情,跟算命的區(qū)別在于最后一點:如果算命先生說的不對,你也不能回頭去找他把攤兒掀了;而數(shù)據(jù)分析總是說得不對的話,攤兒可能真就沒了。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網絡(LSTM)作為循環(huán)神經網絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數(shù)據(jù)中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03