
數(shù)據(jù)分析必須掌握的十個(gè)經(jīng)典方法
下面十個(gè)方法都是我這么多年做互聯(lián)網(wǎng)運(yùn)營(yíng)分析時(shí)一定會(huì)用到的最經(jīng)典的方法。這些方法如果爛熟于心,其實(shí)互聯(lián)網(wǎng)運(yùn)營(yíng)分析的最核心部分也就掌握差不多了。真沒那么復(fù)雜。
我們從第十個(gè)方法倒著講,重要性并無優(yōu)劣之分,但壓軸的,往往是最重要的。
方法十:Link Tag的流量標(biāo)記
Link tag標(biāo)記流量源頭 ,絕對(duì)是所有方法中最為基本重要的一種。這種方法不僅僅適用于網(wǎng)站的流量來源,也同樣適用于app下載來源的監(jiān)測(cè)(但后者需要滿足一定的條件)。
Link tag的意思,是在流量源頭的鏈出鏈接上(鏈出URL上)加上尾部參數(shù)。這些參數(shù)不僅不會(huì)影響鏈接的跳轉(zhuǎn),而且能夠標(biāo)明這個(gè)鏈接所屬的流量源是什么(理論上能夠標(biāo)明流量源的屬性數(shù)是無限的)。
Link tag不能單獨(dú)起作用,必須要在網(wǎng)站分析工具或者app分析工具的配合下工作。
Link tag是流量分析的基礎(chǔ),要嚴(yán)肅的分析流量,不僅僅是常規(guī)分析,還包括歸因分析(attribution analysis),都需要使用link tag的方法。
方法九:轉(zhuǎn)化漏斗
分析轉(zhuǎn)化的基本模型是轉(zhuǎn)化漏斗(conversion funnel),這個(gè)大家都應(yīng)該很熟悉了。
轉(zhuǎn)化漏斗最常見的是把最終的轉(zhuǎn)化設(shè)置為某種目的的實(shí)現(xiàn),最典型的就是實(shí)現(xiàn)銷售,所以大家很多時(shí)候把轉(zhuǎn)化和銷售是混為一談。但轉(zhuǎn)化漏斗的最終轉(zhuǎn)化也可以是其他任何目的的實(shí)現(xiàn),比如一次使用app的時(shí)間超過10分鐘(session duration >10minutes)。對(duì)于增長(zhǎng)黑客而言,構(gòu)建漏斗是最為常見的工作。
漏斗幫助我們解決兩方面的問題,第一、在一個(gè)過程中是否發(fā)生泄漏,如果有泄漏,我們能在漏斗中看到,并且能夠通過進(jìn)一步的分析堵住這個(gè)泄漏點(diǎn);第二、在一個(gè)過程中是否出現(xiàn)了其他不應(yīng)該出現(xiàn)的過程,造成轉(zhuǎn)化主進(jìn)程受到損害。
漏斗的構(gòu)建很簡(jiǎn)單,無論web還是app,都是最好用的方法之一。但漏斗使用的奧秘則很豐富。而且漏斗方法還會(huì)和其他方法混合使用,樂趣無窮。我在互聯(lián)網(wǎng)數(shù)據(jù)運(yùn)營(yíng)的課程中也會(huì)具體講解。
方法八:微轉(zhuǎn)化
人人都懂轉(zhuǎn)化漏斗,但不是所有人都關(guān)注微轉(zhuǎn)化。但是你想指望一個(gè)轉(zhuǎn)化漏斗不斷提升轉(zhuǎn)化率太困難了,而微轉(zhuǎn)化卻可以做到。轉(zhuǎn)化漏斗解決的是轉(zhuǎn)化過程中的大問題,但大問題總是有限的,這些問題搞定后,你還是需要對(duì)你的轉(zhuǎn)化進(jìn)行持續(xù)優(yōu)化,這個(gè)時(shí)候必須要用到微轉(zhuǎn)化。
微轉(zhuǎn)化是指在轉(zhuǎn)化必經(jīng)過程之外,但同樣會(huì)對(duì)轉(zhuǎn)化產(chǎn)生影響的各種元素。這些元素與用戶的互動(dòng),左右了用戶的感受,也直接或者間接的影響了用戶的決定。
比如,商品的一些圖片展示,并不是轉(zhuǎn)化過程中必須要看的,但是它們的存在,是否會(huì)對(duì)用戶的購買決定產(chǎn)生影響?這些圖片就是微轉(zhuǎn)化元素。
個(gè)人認(rèn)為,研究微轉(zhuǎn)化比研究轉(zhuǎn)化更好玩。有一些案例,課堂上跟大家講。
方法七:合并同類項(xiàng)
合并同類項(xiàng)是大家容易忽視的常用方法。我們往往非常重視細(xì)分,但有的時(shí)候我們卻需要了解更宏觀的表現(xiàn)。
合并同類項(xiàng)就是這樣的方法。舉一個(gè)例子,我問你,一個(gè)電子商務(wù)網(wǎng)站,所有商品頁的整體表現(xiàn)如何?它們作為一個(gè)整體的bounce rate怎么樣,停留時(shí)間怎么樣,用戶滿意度怎么樣等等,你能夠回答嗎?
如果我們查看每一個(gè)商品頁的表現(xiàn),然后再把所有一個(gè)一個(gè)頁面的數(shù)據(jù)加總起來作分析,就太麻煩了(根本無法實(shí)現(xiàn)分析)。這個(gè)時(shí)候,我們必須要合并同類項(xiàng)。
如何合并?利用分析工具的過濾工具或者查找替換功能。不支持這樣功能的工具你可以考慮扔掉了,因?yàn)檫@根本不應(yīng)放在增長(zhǎng)黑客的專業(yè)裝備箱中。
合并同類項(xiàng)還有很多用途,比如你要了解web或者app一個(gè)版塊(頻道)的整體表現(xiàn),或者你要了解整個(gè)導(dǎo)航體系的使用情況,這都是必須使用的方法。
方法六:AB測(cè)試
增長(zhǎng)黑客不談AB測(cè)試是恥辱。
通過數(shù)據(jù)優(yōu)化運(yùn)營(yíng)和產(chǎn)品的邏輯很簡(jiǎn)單——看到問題,想個(gè)主意,做出原型,測(cè)試定型。
比如,你發(fā)現(xiàn)轉(zhuǎn)化漏斗中間有一個(gè)漏洞,于是你想,一定是商品價(jià)格不對(duì)頭,讓大家不想買了。你看到了問題——漏斗,而且你也想出了主意——改變定價(jià)。
但是這個(gè)主意靠不靠譜,可不是你想出來的,必須得讓真實(shí)的用戶用。于是你用AB測(cè)試,一部分的用戶還是看到老價(jià)格,另外一部分用戶看到新價(jià)格。若是你的主意真的管用,新價(jià)格就應(yīng)該有更好的轉(zhuǎn)化。若真如此,新的價(jià)格就被確定下來(定型),開始在新的轉(zhuǎn)化高度上運(yùn)行,直到你又發(fā)現(xiàn)一個(gè)新的需要改進(jìn)的問題。
增長(zhǎng)黑客的一個(gè)主要思想之一,是不要做一個(gè)大而全的東西,而是不斷做出能夠快速驗(yàn)證的小而精的東西??焖衮?yàn)證,如何驗(yàn)證的?主要方法就是AB測(cè)試。
今天的互聯(lián)網(wǎng)世界,由于流量紅利時(shí)代的結(jié)束,對(duì)于快速迭代的要求大大提升了,這也使我們更加在意測(cè)試的力量。
在web上進(jìn)行AB測(cè)試很簡(jiǎn)單,在app上難度要高很多,但解決方法還是很多的。國(guó)外那些經(jīng)典app,那些賣錢游戲,幾乎天天都在AB測(cè)試。
方法五:熱圖及對(duì)比熱圖
熱圖是一個(gè)大家都喜歡的功能,它是最直觀的記錄用戶與產(chǎn)品界面交互的工具。不過真用起來,可能大家很少真正去深究吧!
熱圖,對(duì)于web、app的分析,都非常重要!今天的熱圖相對(duì)于過去的熱圖,功能得到了極大的提升。
在web端,過去一些解決不好的問題,比如只能看鏈接的被點(diǎn)擊情況,點(diǎn)擊位置錯(cuò)位,對(duì)浮層部分點(diǎn)擊的標(biāo)記,對(duì)鏈出鏈接的標(biāo)記等等,現(xiàn)在已經(jīng)有好的工具能夠提供很多新的辦法去解決。在app端則分為兩種情況,內(nèi)容類的app,對(duì)于熱圖的需求較弱;但工具類的app對(duì)于熱圖的需求則很顯著。前者的screen中以并列內(nèi)容為主,且內(nèi)容動(dòng)態(tài)變換,熱圖應(yīng)用價(jià)值不高;后者則特別需要通過熱圖反映用戶的使用習(xí)慣,并結(jié)合app內(nèi)其他的engagement的分析(in-app engagement)來優(yōu)化功能和布局設(shè)計(jì),所以熱圖對(duì)它們很重要。
要想熱圖用的好,一個(gè)很重要的點(diǎn)在于你幾乎不能單獨(dú)使用一個(gè)熱圖就想解決問題。我常常用集中對(duì)比熱圖的方法。
其一,多種熱圖的對(duì)比分析,尤其是點(diǎn)擊熱圖(觸摸熱圖)、閱讀線熱圖、停屏熱圖的對(duì)比分析;
其二,細(xì)分人群的熱圖對(duì)比分析,例如不同渠道、新老用戶、不同時(shí)段、AB測(cè)試的熱圖對(duì)比等等。
其三,深度不同的互動(dòng),所反映的熱圖也是不同的。這種情況也值得利用熱圖對(duì)比功能。例如點(diǎn)擊熱圖與轉(zhuǎn)化熱圖的對(duì)比分析等。
總之,分析很多用戶交互的時(shí)候,熱圖簡(jiǎn)直是神器,只不過,熱圖真的比你看到的要更強(qiáng)大!
方法四:Event Tracking(事件追蹤)
互聯(lián)網(wǎng)運(yùn)營(yíng)數(shù)據(jù)分析的一個(gè)很重要的基礎(chǔ)是網(wǎng)站分析。今天的app分析、流量分析、渠道分析,還有后面要講到的歸因分析等等,都是在網(wǎng)站分析的基礎(chǔ)之上發(fā)展起來的。
但是,早期的網(wǎng)站分析有一個(gè)特點(diǎn),就是對(duì)于用戶在頁面上互動(dòng)行為的記錄,只能記錄下來一種,就是點(diǎn)擊http鏈接(點(diǎn)擊URL)。不過隨著技術(shù)的發(fā)展,頁面上不僅僅只有http鏈接,頁面上還有很多flash(現(xiàn)在flash都要被淘汰了)、JavaScript的互動(dòng)鏈接、視頻播放、鏈接到其他的web或者app的鏈接等等,用戶點(diǎn)擊這些東西就都無法被老方法記錄下來了。
不過,有問題就一定有方法,人們發(fā)明了event tracking來解決上面的問題。event tracking本質(zhì)上是對(duì)這些特殊互動(dòng)的定制化監(jiān)測(cè),而由于是定制化,所以反而有了更多附加的好處,即可以額外添加對(duì)于這個(gè)活動(dòng)的更多的說明(以event tracking這個(gè)方法的附件屬性的方式)。結(jié)果,這個(gè)方法甚至有些反客為主,即使是一些http鏈接,很多分析老手也喜歡把它們加上event tracking(技術(shù)上完全可行),以獲得更多的額外監(jiān)測(cè)屬性說明。
隨著app的出現(xiàn),由于app的特殊性(屏幕小,更強(qiáng)調(diào)在一個(gè)屏幕中完成互動(dòng)),分析app的page(實(shí)際上應(yīng)該是app的screen)間跳轉(zhuǎn)的重要性完全不如web上的page之間的跳轉(zhuǎn),但分析app上的點(diǎn)擊行為的重要性則十分巨大,這就使我們分析in-app engagement的時(shí)候,必須大量依賴event,而相對(duì)較少使用screen。這就是說,在app端,event反而是主,page(更準(zhǔn)確應(yīng)該是screen)反而是輔!
這也是為什么,這個(gè)方法你必須要掌握的原因。
方法三:Cohort分析
Cohort分析還沒有一個(gè)所有人都統(tǒng)一使用的翻譯。有的說是隊(duì)列分析,有的說是世代分析,有的說是隊(duì)列時(shí)間序列分析。
無論哪種叫法,cohort分析在有數(shù)據(jù)運(yùn)營(yíng)領(lǐng)域都變得十分重要。原因在于,隨著流量經(jīng)濟(jì)的退卻,精耕細(xì)作的互聯(lián)網(wǎng)運(yùn)營(yíng)特別需要仔細(xì)洞察留存情況。Cohort分析最大的價(jià)值也正在于此。Cohort分析通過對(duì)性質(zhì)完全一樣的可對(duì)比群體的留存情況的比較,來發(fā)現(xiàn)哪些因素影響短、中、長(zhǎng)期的留存。
Cohort分析受到歡迎的另一個(gè)原因是它用起來十分簡(jiǎn)單,但卻十分直觀。相較于比較繁瑣的流失(churn)分析,RFM或者用戶聚類等,Cohort只用簡(jiǎn)單的一個(gè)圖表,甚至連四則運(yùn)算都不用,就直接描述了用戶在一段時(shí)間周期(甚至是整個(gè)LTV)的留存(或流失)變化情況。甚至,Cohort還能幫你做預(yù)測(cè)。
我總覺得cohort分析是最能體現(xiàn)簡(jiǎn)單即美的一個(gè)典型方法。
方法二:Attribution(歸因)
歸因不是人人都聽說過,用好的更是寥寥無幾。 不過,考慮到人們購買某一樣?xùn)|西的決策,可能受到多種因素(數(shù)字營(yíng)銷媒體)的影響,比如看到廣告了解到這個(gè)商品的存在,利用搜索,進(jìn)一步了解這個(gè)商品,然后在social渠道上看到這個(gè)商品的公眾號(hào)等等。這些因素的綜合,讓一個(gè)人下定了決心購買。
因此,很多時(shí)候,單一的廣告渠道并不是你打開客戶閘門的閥門,而是多種渠道共同作用的結(jié)果。
如何了解數(shù)字營(yíng)銷渠道之間的這種先后關(guān)系或者相互作用?如何設(shè)置合理的數(shù)字營(yíng)銷渠道的策略以促進(jìn)這種關(guān)系?在評(píng)價(jià)一個(gè)渠道的時(shí)候,如何將歸因考慮在內(nèi)從而能夠更客觀的衡量?這些都需要用到歸因。
如果你是互聯(lián)網(wǎng)營(yíng)銷的負(fù)責(zé)人,歸因分析是必不可少的分析方法。在我的課堂上,會(huì)特別多的篇幅講解這個(gè)方法。
方法一:細(xì)分
嚴(yán)格說,細(xì)分不是一種方法,它是一切分析的本源。所以它當(dāng)之無愧要排名第一。
我經(jīng)常的口頭禪是,無細(xì)分、毋寧死。沒有細(xì)分你做什么分析呀。
細(xì)分有兩類,一類是一定條件下的區(qū)隔。如:在頁面中停留30秒以上的visit(session);或者只要北京地區(qū)的訪客等。其實(shí)就是過濾。另一類是維度(dimension)之間的交叉。如:北京地區(qū)的新訪問者。即分群(segmentation)。
細(xì)分幾乎幫助我們解決所有問題。比如,我們前面講的構(gòu)建轉(zhuǎn)化漏斗,實(shí)際上就是把轉(zhuǎn)化過程按照步驟進(jìn)行細(xì)分。流量渠道的分析和評(píng)估也需要大量用到細(xì)分的方法。
維度之間的交叉是比較體現(xiàn)一個(gè)人分析水平的細(xì)分方法。比如,我的朋友孫維(卡車之家的數(shù)據(jù)負(fù)責(zé)人),他將用戶的反饋?zhàn)鳛閑vent tracking的屬性(放在了event action屬性中),提交給GA,然后在自定義的報(bào)告中,將用戶反饋和用戶的其他行為交叉起來,從而看到有某一類反饋的用戶,他們的行為軌跡是什么,從而推測(cè)發(fā)生了什么問題。
分析跳出率時(shí),我們也會(huì)把landing page和它的traffic source(流量源)進(jìn)行交叉,以檢查高跳出率的表現(xiàn)是由著陸頁造成,還是由流量造成。這也是典型的維度交叉細(xì)分的應(yīng)用。
無細(xì)分,毋寧死。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10CDA 數(shù)據(jù)分析師:商業(yè)數(shù)據(jù)分析實(shí)踐的落地者與價(jià)值創(chuàng)造者 商業(yè)數(shù)據(jù)分析的價(jià)值,最終要在 “實(shí)踐” 中體現(xiàn) —— 脫離業(yè)務(wù)場(chǎng)景的分 ...
2025-09-10機(jī)器學(xué)習(xí)解決實(shí)際問題的核心關(guān)鍵:從業(yè)務(wù)到落地的全流程解析 在人工智能技術(shù)落地的浪潮中,機(jī)器學(xué)習(xí)作為核心工具,已廣泛應(yīng)用于 ...
2025-09-09SPSS 編碼狀態(tài)區(qū)域中 Unicode 的功能與價(jià)值解析 在 SPSS(Statistical Product and Service Solutions,統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案 ...
2025-09-09