
2023-04-03
主持人:
2023 CDAS「心中有數(shù)」峰會,舉辦在即。
舉辦前,我們邀請到了CDAS的峰會演講嘉賓——數(shù)據(jù)分析行業(yè)大牛曾津老師來參加我們的CDA持證人采訪。曾老師可以和大家打個(gè)招呼。
嘉賓:
大家好,海龍老師好。
我簡單給大家做一個(gè)自我介紹。其實(shí)我跟我們CDA 是挺有淵源的。我是 CDA LEVEL 3 數(shù)據(jù)科學(xué)家的持證人。曾經(jīng)先后在探探,以及去哪兒網(wǎng)等一些互聯(lián)網(wǎng)公司作為數(shù)據(jù)分析和數(shù)據(jù)產(chǎn)品的負(fù)責(zé)人。
那么主要在公司負(fù)責(zé)指標(biāo)體系的搭建、BI系統(tǒng)的構(gòu)建、實(shí)驗(yàn)分析還有用戶畫像等等這樣一系列跟數(shù)據(jù)相關(guān)的工作。
今天非常高興能夠到這里,跟大家一起來交流關(guān)于數(shù)據(jù)分析師這個(gè)崗位和數(shù)據(jù)賦能相關(guān)的內(nèi)容。
問題 1:
作為一個(gè)擁有10多年的數(shù)據(jù)分析工作經(jīng)驗(yàn)的資深分析師,可以給我們介紹一下互聯(lián)網(wǎng)企業(yè)中數(shù)據(jù)分析和數(shù)據(jù)科學(xué)都是從哪些方面賦能給業(yè)務(wù)的嗎?
嘉賓:
以我個(gè)人的工作經(jīng)驗(yàn)來講的話,互聯(lián)網(wǎng)企業(yè)里面對于數(shù)據(jù)賦能,其實(shí)主要分為兩個(gè)大的方面。
第一個(gè)大的方面其實(shí)是數(shù)據(jù)診斷。
所謂的數(shù)據(jù)診斷就是在構(gòu)建完一套比較合理的指標(biāo)體系的基礎(chǔ)上,我們?nèi)ネㄟ^數(shù)據(jù)發(fā)現(xiàn)問題、診斷問題,幫助找到業(yè)務(wù)上發(fā)展不好的章節(jié)。這個(gè)叫數(shù)據(jù)診斷。
數(shù)據(jù)診斷里面其實(shí)我歸納一下有兩字訣:
第一個(gè)字就是拆。大問題拆成小問題,難問題拆成簡單的問題。
像平時(shí)的這個(gè)金字塔原理。
還有漏斗思維,然后這些其實(shí)都屬于拆分的思維。
第二個(gè)字其實(shí)是比。指的是各種比較。
比如說可以通過帕累托原則跟我們自己比。找出真正能解決80%問題的20%的這些小的點(diǎn)。
?
另外還可以根據(jù)行業(yè)比,跟其他的類似的要點(diǎn)比。
所以說,數(shù)據(jù)指標(biāo)體系構(gòu)建的基礎(chǔ)上的一個(gè)拆一個(gè)比。這是數(shù)據(jù)診斷方面。
另外一個(gè)方面,其實(shí)是數(shù)據(jù)策略應(yīng)用。
我們企業(yè)一般會積累很多數(shù)據(jù),這些數(shù)據(jù)是數(shù)以TB級的,所以這么大量的數(shù)據(jù)如果沒有形成策略,沒有形成應(yīng)用那是非??上У摹?br>
或者是我們可以依靠數(shù)據(jù)構(gòu)建用戶畫像,對用戶做一些差異化的策略。然后千人千面,讓我們的企業(yè)能夠有更好的效果。
問題 2:
能舉個(gè)例子嗎?比方說業(yè)務(wù)數(shù)據(jù)的診斷過程當(dāng)中,昨天的日活量它下跌了30%,今天的這種轉(zhuǎn)化率成交量還不超過1%。
嘉賓:
業(yè)務(wù)診斷在數(shù)據(jù)分析師日常工作中是非常非常重要的一個(gè)點(diǎn)。
剛才我也提到了,對于業(yè)務(wù)診斷的第一步其實(shí)是拆,第二步是比。
我們其實(shí)就用我剛才提到那個(gè)拆的思路來就是應(yīng)對一下海龍老師這兩個(gè)問題。
比如說DAU某一天跌了30%,那首先我們就要想到,怎么樣把這個(gè)30%的下跌量拆分到不同的一些簡單的維度或者問題中去。
打個(gè)比方說其實(shí)可以用DAU的公式去拆解。
DAU=DNU+留存的用戶+回流的用戶。
所以 DAU 無非是這三個(gè)部分組成的。
做了第一層拆解之后我們就要看,DAU 下跌30%是新增用戶貢獻(xiàn)多少,留存用戶貢獻(xiàn)多少,回流用戶貢獻(xiàn)多少。針對這三個(gè)不同的用戶的原因,其實(shí)我們可以進(jìn)一步拆解。
如果是新增用戶對下降貢獻(xiàn)的比例比較大,我們需要看哪一個(gè)新增渠道下降最多,那么去做進(jìn)一步拆解。
如果是留存的數(shù)據(jù)下降比較大,那么這個(gè)時(shí)候我們需要去做的一件事情是什么呢?
首先需要看是哪一個(gè)人群留存下降特別多,或是哪一個(gè)手機(jī)平臺,iOS或者PC端哪個(gè)下降比較多。通過這種拆解的方式,一步一步接近真相接近重要的答案。
通過這個(gè)方式我們就能夠了解到 DAU 下降30%的原因最具體歸因于是在哪一塊。
這是王老師的第一個(gè)問題,我們再來看第二個(gè)問題,就是轉(zhuǎn)化率。
從瀏覽頁面到購買下單的這個(gè)轉(zhuǎn)化率不超過1%,這個(gè)怎么解決?
仍然是第一步是拆,只不過在這里的拆我們可能又要用到另外一種工具,就是漏斗拆分。
我們可以思考,從瀏覽頁面到下單,其實(shí)一共可以分成4個(gè)步驟。
第一步是瀏覽頁面,第二步是商品詳情,第三步是下單,第四步是支付。
可能經(jīng)過這4個(gè)步驟,每一個(gè)步驟它其實(shí)都是一個(gè)漏斗。漏斗的環(huán)節(jié)率轉(zhuǎn)化越低,越是我們需要關(guān)注的環(huán)節(jié)點(diǎn)。
比方說,我們從瀏覽到詳情頁的轉(zhuǎn)化率低,原因大概率是推薦算法或者推薦策略不奏效。沒有推到這個(gè)用戶比較喜歡的商品,所以用戶不會點(diǎn)擊。
如果修復(fù)了、優(yōu)化了算法之后,這個(gè)轉(zhuǎn)化率就會有所提升。
再比如說如果已經(jīng)下單了,還沒有支付。
那這種情況下,第一個(gè)要不然用戶可能手頭不是特別寬裕,這個(gè)時(shí)候可能會給他一個(gè)補(bǔ)助的優(yōu)惠券輔助他下單,那么另外可能就是我們的下單接口到支付接口是不是有一些bug,會有一些問題。如果一旦修復(fù),這個(gè)轉(zhuǎn)化率也上去了。
因?yàn)槁┒贩治鏊鳝h(huán)節(jié)之間是一個(gè)乘數(shù)的關(guān)系,每一個(gè)環(huán)節(jié)的轉(zhuǎn)化率是一個(gè)乘法的關(guān)系。所以你每優(yōu)化一個(gè)環(huán)節(jié),都會使你的轉(zhuǎn)化率有一個(gè)非常大的提升。
主持人:
其實(shí)聽了曾老師這個(gè)介紹,我就是聽到了兩個(gè)字,第一個(gè)字就是“拆”,第二個(gè)字還是“比”對。
就是你先拆找到原因,然后在這個(gè)原因的基礎(chǔ)上你去對比說哪個(gè)的這個(gè)得分降低最大,在那個(gè)基礎(chǔ)上我們再去修復(fù)你的這個(gè)規(guī)則,指標(biāo)體系選擇的合理與否,直接影響到這個(gè)評判的標(biāo)準(zhǔn)。
問題 3:
那我們該如何搭建一個(gè)這種科學(xué)的指標(biāo)體系呢?
嘉賓:
這個(gè)問題確實(shí)是非常重要的一個(gè)問題。
其實(shí)我們大家可能會認(rèn)為,指標(biāo)體系是一個(gè)非?;A(chǔ)的事,可能并不是特別難,但是實(shí)際上它對于我們數(shù)據(jù)分析來講是一個(gè)非常重要的事。
因?yàn)榍蓩D難為無米之炊,如果沒有指標(biāo)體系的話,后面所有的分析都是搭建在一個(gè)空中樓閣的基礎(chǔ)上。
正常的在企業(yè)中,從零搭建一套指標(biāo)體系可以有一個(gè)模型可以借鑒,這個(gè)模型我們把它叫做 OSM 模型,它實(shí)際是將目標(biāo)、戰(zhàn)略和度量三個(gè)單詞的首字母結(jié)合到一起作為這樣的一個(gè)模型。
O 就是目標(biāo)。第一步就是找到我們的目標(biāo),俗稱北極星指標(biāo)。所有的業(yè)務(wù)動(dòng)作,都需要圍繞這個(gè)北極星指標(biāo)去貫徹。
比如說淘寶,它肯定是以 GMV 為北極星指標(biāo)。再比如說Facebook,F(xiàn)acebook它是一個(gè)社交網(wǎng)絡(luò),所以它的北極星指標(biāo)是一個(gè)用戶量。
什么樣的指標(biāo)適合做北極星指標(biāo)呢?
那必須是滿足兩個(gè)方面的條件:
第一個(gè)是滿足用戶價(jià)值。也就說這個(gè)北極星指標(biāo)必須能夠體現(xiàn)用戶對產(chǎn)品或者這個(gè)業(yè)務(wù)的喜愛程度,這是第一個(gè)方面。
第二方面它必須滿足我們企業(yè)的商業(yè)價(jià)值。也就是說如果這個(gè)北極星指標(biāo)上漲,企業(yè)就能夠掙到更多的錢。
第二步就是策略。其實(shí)我們圍繞實(shí)現(xiàn)北極星指標(biāo)提升這個(gè)目標(biāo),我們需要訂立很多的策略。這個(gè)策略就是我們制定指標(biāo)體系的關(guān)鍵。
比方說,我的公司如果讓 DAU 作為我的北極星指標(biāo),那么我的策略無非有三條。
第一個(gè)是拉新增,就是讓大量的這個(gè)新增用戶來我的這個(gè)產(chǎn)品上體驗(yàn)。
第二個(gè)策略是促留存,讓用戶留下來。
第三個(gè)是回流召回,這個(gè)時(shí)候我們的指標(biāo)可能要圍繞這個(gè)新增用戶 DNU 和這個(gè)留存用戶的這個(gè)留存率,以及回流用戶的數(shù)量,這樣一些數(shù)據(jù)指標(biāo)來進(jìn)行構(gòu)建。
OSM中M實(shí)際上是測量,就是說我們要找到可以計(jì)量,并且容易操作的指標(biāo)來考量我前面說的策略是否執(zhí)行得好。
這個(gè)是我們構(gòu)建一套指標(biāo)體系的方法。
另外在增長黑客領(lǐng)域,還有一些非常著名的指標(biāo)體系。
比如說海盜法則,這也是我們能夠在這個(gè)構(gòu)建指標(biāo)體系的時(shí)候參考的一些依據(jù)。
問題 4:
您剛才也提到了數(shù)據(jù)賦能業(yè)務(wù)這一方面的這個(gè)策略應(yīng)用,就是您能詳細(xì)的舉一個(gè)例子或者說明策略應(yīng)用的內(nèi)容嗎?
嘉賓:
其實(shí)數(shù)據(jù)應(yīng)用在我們互聯(lián)網(wǎng)企業(yè)里面有很多體現(xiàn)。
首先我想舉的一個(gè)例子是用戶畫像。
用戶畫像其實(shí)我們大家其實(shí)都比較了解。它能夠給企業(yè)帶來千人千面的策略,為用戶提供更加個(gè)性化的體驗(yàn)。
比如說我們身邊都能接觸到的抖音和快手,通過用戶畫像和推薦策略是能夠讓我們體驗(yàn)出那種沉浸感。
然后再比如說視頻網(wǎng)站。通過分析用戶畫像和歷史數(shù)據(jù),能夠知道你更喜歡哪位明星。
用畫像的好處是能夠用非常少的成本為我們?nèi)カ@得比較大的產(chǎn)品收益。
另外,在這個(gè)增長黑客里面還會經(jīng)常提到的一個(gè)概念,就是魔法數(shù)字。
如果一個(gè)用戶能夠在我們運(yùn)營的體系的引導(dǎo)下完成這樣一個(gè)數(shù)字,他就能夠見證我們產(chǎn)品和業(yè)務(wù)的美好,他就會留下來繼續(xù)使用我們的產(chǎn)品。
比如說Facebook,他們的分析師通過分析數(shù)據(jù)就發(fā)現(xiàn)新增用戶在注冊7天內(nèi)加了10個(gè)好友,那么他就會長期留存在他們的平臺。
有了這樣魔法數(shù)字,運(yùn)營或者產(chǎn)品的同事就能夠設(shè)計(jì)一些打卡活動(dòng),然后或者設(shè)計(jì)一些產(chǎn)品功能引導(dǎo)用戶完成這個(gè)魔法數(shù)字,最終成為我們的忠實(shí)用戶。
還有一個(gè)場景就是AB測試。
比如說產(chǎn)品經(jīng)理認(rèn)為,我們的文案這樣設(shè)計(jì)可能會帶來更多的轉(zhuǎn)化率,那么他沒有量化的支撐,他只是憑自己對產(chǎn)品的經(jīng)驗(yàn)和認(rèn)知得出這樣的結(jié)論。
但是,如果數(shù)據(jù)分析師幫助他們用AB測試的方式去,測一下就能夠告訴他你用這個(gè)文案能夠提升3%的轉(zhuǎn)化率,能夠非常直觀和量化的給予他迭代的結(jié)果和依據(jù)。
問題 5:
在深耕數(shù)據(jù)領(lǐng)域的這幾年,您感觸最深的是什么?然后有哪些成就感,同時(shí)又遇到了哪些挫折呢?
嘉賓:
有兩點(diǎn)感觸是相對比較深的。
第一個(gè)感觸就是數(shù)據(jù)分析也好,數(shù)據(jù)科學(xué)也好,這個(gè)崗位實(shí)際上是終身學(xué)習(xí)的崗位,并不是說可以一蹴而就的。
無論是你在工作第幾年的時(shí)候,都需要有這種學(xué)習(xí)的心態(tài)。
比如說最近出了ChatGPT,然后也非常火?;旧夏軌蛭磥泶笥腥〈阉饕娴内厔?。如果不學(xué)習(xí)這樣?xùn)|西,不保持長期的這樣學(xué)習(xí)的心態(tài),是很容易落伍的。
第二個(gè)點(diǎn)人與人的差異,企業(yè)與企業(yè)差異是非常之巨大的。
人與人的差異我舉個(gè)例子,其實(shí)數(shù)據(jù)分析師這個(gè)崗位來講,是易學(xué)難精的崗位。
入門非常簡單,可能你通過Excel或者通過SQL這樣一些很簡單的工具,你就能夠成為初級的數(shù)據(jù)分析師。
但是你要到了真正能夠去影響業(yè)務(wù),能夠達(dá)到比較高層次分析師的水準(zhǔn),其實(shí)是需要很多的努力,才能達(dá)到的。
第二個(gè)就是,企業(yè)與企業(yè)之間的差異也非常之巨大。
有些企業(yè)數(shù)據(jù)庫里面有數(shù)以TB的數(shù)據(jù),但是沒有應(yīng)用。所以在企業(yè)從數(shù)據(jù)到應(yīng)用的這個(gè)過程中是有g(shù)ap的。
這個(gè)gap你要跳過去是驚險(xiǎn)的一跳,那么在這個(gè)過程中必須需要產(chǎn)品經(jīng)理、運(yùn)營、數(shù)據(jù)分析師以及企業(yè)領(lǐng)導(dǎo)能夠通力合作,才能夠使企業(yè)完成這樣數(shù)字化的跳躍過程。
剛才王老師提到了最開心的或者最有成就感的事情是什么,那一定是自己的數(shù)據(jù)洞見和數(shù)據(jù)分析的結(jié)論為起為業(yè)務(wù)所用,能夠起到真正的作用。
那其實(shí)最大的挫折也是我們分析了半天,最后沒有用上,沒有起到實(shí)際的業(yè)務(wù)效果。
所以說作為數(shù)據(jù)分析師這樣一個(gè)崗位來講,他的喜怒其實(shí)是跟業(yè)務(wù)應(yīng)用息息相關(guān)的。
主持人:
最近曾老師也上架了一本新書《數(shù)據(jù)分析實(shí)戰(zhàn)——方法、工具與可視化》,您是什么樣的契機(jī)激發(fā)寫這本書的呢?
嘉賓:
其實(shí)我寫這本書跟我個(gè)人的這樣一個(gè)工作經(jīng)歷是息息相關(guān)的。
因?yàn)閯偛盘岬?,我其?shí)并不是一個(gè)科班出身的數(shù)據(jù)分析師。我其實(shí)是一個(gè)文科生。
所以我一路從數(shù)據(jù)分析這個(gè)崗位走過來,我知道一個(gè)數(shù)據(jù)分析師從初中級走到高級他需要做些什么。
所以我希望給大家寫這樣一本關(guān)于實(shí)踐的書,尤其是關(guān)于初、中級數(shù)據(jù)分析師,或者是非我們數(shù)據(jù)分析行業(yè),想了解這塊內(nèi)容的這樣一些讀者。這是寫這本書的初衷。
第一個(gè)方面就是希望這本書能夠大家拿起來看就懂,并且其中有260張圖片,畢竟圖片還是傳達(dá)信息最快的方式,所以整本書要做到第一個(gè)點(diǎn)。
第二個(gè)就是翻開看就能用,這本書里面有50多個(gè)案例,都是一線互聯(lián)網(wǎng)企業(yè)中
最直接,最接觸到這個(gè)前沿的這樣一些案例。
主要的覆蓋對象其實(shí)是三類人。
第一類的人,剛才提到初、中級數(shù)據(jù)分析師想要讓自己的理論和工具真正應(yīng)用到業(yè)務(wù)上的這一類人。
第二類其實(shí)是我們這個(gè)其他崗位上想要通過數(shù)據(jù)賦能,來幫助自己提升業(yè)務(wù)效果的產(chǎn)品經(jīng)理或者運(yùn)營這樣一部分人。
第三類這本書還比較適合于學(xué)校中的學(xué)生,將來想從事數(shù)據(jù)分析工作的學(xué)生。因?yàn)槔锩娴暮芏啵@個(gè)實(shí)戰(zhàn)和工具以及理論是大家直接在面試的時(shí)候就能夠用到的。
主持人:
那其實(shí)像曾老師今天說的這個(gè)內(nèi)容,我們在這本書里面都有講到大家喜歡這本書的可以去京東和當(dāng)當(dāng)去搜。謝謝大家的觀看。
完 謝謝觀看