
數(shù)據(jù)分析基礎(chǔ)篇(設(shè)計(jì)師都應(yīng)該了解)
當(dāng)今設(shè)計(jì)師還不了解數(shù)據(jù),自身價(jià)值也將會(huì)越來(lái)越低
第1則- 前言
數(shù)據(jù)分析是一塊知識(shí)領(lǐng)域,是一門學(xué)科性很強(qiáng)的科目,想要短時(shí)間內(nèi)吃透并不簡(jiǎn)單,在進(jìn)入這個(gè)領(lǐng)域之前,我們需要學(xué)習(xí)一些基本的業(yè)務(wù)常識(shí),結(jié)合業(yè)務(wù)來(lái)理解效果會(huì)更好。我把數(shù)據(jù)分析的業(yè)務(wù)流程整理成一張圖幫助大家理解,大致分為「獲取數(shù)據(jù)」、「處理數(shù)據(jù)」、「數(shù)據(jù)結(jié)果」、「分析原因」、「業(yè)務(wù)提煉」五大模塊。今天著重聊一聊前三個(gè)模塊,后兩個(gè)模塊會(huì)在后面的文段中穿插闡述。
第2則- 數(shù)據(jù)庫(kù)的來(lái)源
數(shù)據(jù)庫(kù)(可以從公司內(nèi)部的數(shù)據(jù)庫(kù)抓取想要的數(shù)據(jù))
數(shù)據(jù)平臺(tái)(神策,MTA,talkingdata,諸葛io等等,需要接入自身產(chǎn)品)
自建數(shù)據(jù)平臺(tái)(大廠或資本較雄厚的公司會(huì)有自己的數(shù)據(jù)平臺(tái),另外也有一些開(kāi)源的可以免費(fèi)使用,例如「superset」from airbnb)
爬蟲(chóng)(這是最常見(jiàn)的一種方式,需要一定的編程基礎(chǔ)。一般來(lái)說(shuō)就是技術(shù)人員寫代碼爬取用戶,競(jìng)對(duì)的數(shù)據(jù),相應(yīng)的,也會(huì)有反爬蟲(chóng)技術(shù)。)
市場(chǎng)調(diào)研(問(wèn)卷調(diào)查,電話訪談,實(shí)地調(diào)查)
第3則- 方法論
數(shù)據(jù)分析大致可以分為:數(shù)理性分析和營(yíng)銷(管理)性分析。前者相較于后者更加簡(jiǎn)便,易上手。后者想要做到精通且靈活運(yùn)用,則需要大量時(shí)間與精力浸淫在工作中,用經(jīng)驗(yàn)來(lái)堆砌功力。數(shù)理性數(shù)據(jù)分析主要針對(duì)類似新增用戶數(shù),日活月活,留存率,轉(zhuǎn)化率,埋點(diǎn)數(shù)據(jù)等等進(jìn)行分析,它又分為:常規(guī)分析法,統(tǒng)計(jì)模型分析法,自建模型分析法。
為了幫助各位系統(tǒng)的學(xué)習(xí)數(shù)據(jù)分析,我把這些理論知識(shí)用結(jié)構(gòu)圖來(lái)表示關(guān)系。
為了呼應(yīng)文章的基礎(chǔ)性,今天我們就一起來(lái)學(xué)習(xí)「常規(guī)分析法」。常規(guī)的數(shù)據(jù)分析法一般都可以分為:趨勢(shì)分析,對(duì)比分析和細(xì)分分析。 接下來(lái)我們將用「同環(huán)比分析法」「ABC分析法」和「漏斗分析法」來(lái)對(duì)應(yīng)說(shuō)明。
同比
拿某個(gè)周期的時(shí)間段與上一個(gè)周期的相同時(shí)間段做比較。例如今年的3月比去年的3月,本周的周三比上周的周一等等。同比增長(zhǎng)率=(本期數(shù)-同期數(shù))/同期數(shù)x100%。覺(jué)得有點(diǎn)暈?我們來(lái)生動(dòng)的舉個(gè)栗子:2016年9月新增245個(gè)人關(guān)注公眾號(hào),2017年9份則有586個(gè)人數(shù)新增,那么公眾號(hào)新增關(guān)注人數(shù)的同比增長(zhǎng)率=(586-245)/245×100%=1.39183673×100%四舍五入為139%。
環(huán)比
相對(duì)更簡(jiǎn)單,就是拿相鄰時(shí)間段做比較,不像同比那樣在相鄰時(shí)間段內(nèi)部某個(gè)相同時(shí)的間點(diǎn)來(lái)對(duì)比。環(huán)比增長(zhǎng)率=(本期數(shù)-上期數(shù))/上期數(shù)×100%。舉個(gè)栗子,2017年9月本公眾號(hào)關(guān)注人數(shù)新增586人,10月則新增172人,那么公眾號(hào)新增關(guān)注人數(shù)的環(huán)比增長(zhǎng)率=(172-586)/586×100%=-0.70648464×100%四舍五入為-71%。
“ABC分析法又稱帕雷托分析法,也叫主次因素分析法,是項(xiàng)目管理中常用的一種方法。它是根據(jù)事物在技術(shù)或經(jīng)濟(jì)方面的主要特征,進(jìn)行分類排隊(duì),分清重點(diǎn)和一般,從而有區(qū)別地確定管理方式的一種分析方法。由于它把被分析的對(duì)象分成A、B、C三類,所以又稱為ABC分析法?!?
以上摘自百度,翻譯成人話來(lái)說(shuō),以同一指標(biāo)為業(yè)務(wù)對(duì)象,進(jìn)行數(shù)量、質(zhì)量、變量等等分析。以該指標(biāo)各維度數(shù)據(jù)與總體數(shù)據(jù)做對(duì)比,按照比重多少排序,將各組成部分分為ABC三類。拿最近發(fā)生的事舉例吧,2017雙11期間,全網(wǎng)的總銷售額為1770.4億元。在分析各電商平臺(tái)銷售額數(shù)據(jù)中,用ABC分析法對(duì)各個(gè)平臺(tái)的銷售總額做進(jìn)一步分析,從圖中我們得知天貓,京東的銷售額對(duì)比全網(wǎng)總銷售額來(lái)說(shuō)占比非常大,得出這樣的結(jié)論之后相關(guān)品牌方就可以在運(yùn)營(yíng)活動(dòng)中進(jìn)一步關(guān)注這兩個(gè)平臺(tái),重點(diǎn)在這兩個(gè)平臺(tái)上做活動(dòng)推廣,宣發(fā),會(huì)大概率獲得更大的收益。通過(guò)合理分配時(shí)間,人力,資源成本到獲益概率大的目標(biāo)(A類)上,是通過(guò)數(shù)據(jù)分析得出的戰(zhàn)略規(guī)劃,但是也不能忽略B類C類,他們只是相比A類應(yīng)得到較少的投入。
所有互聯(lián)網(wǎng)產(chǎn)品、數(shù)據(jù)分析都離不開(kāi)漏斗,無(wú)論是注冊(cè)轉(zhuǎn)化漏斗,還是電商下單的漏斗,需要關(guān)注的有兩點(diǎn)。第一是關(guān)注哪一步流失最多,第二是關(guān)注流失的人都有哪些行為。關(guān)注注冊(cè)流程的每一個(gè)步驟,可以有效定位高損耗節(jié)點(diǎn)。
漏斗分析是一套流程式數(shù)據(jù)分析,它能夠反映用戶的某段操作路徑的全程及轉(zhuǎn)化情況。通過(guò)各相關(guān)節(jié)點(diǎn)數(shù)據(jù)對(duì)比,直觀的發(fā)現(xiàn)問(wèn)題所在,從而進(jìn)行優(yōu)化。舉個(gè)我身邊的例子:11月份小說(shuō)書(shū)豆收入環(huán)比10月份減少了10%,面對(duì)這樣一個(gè)異常的數(shù)據(jù)指標(biāo),我們很難直接判斷出那個(gè)環(huán)節(jié)出了問(wèn)題,尤其是最近還進(jìn)行了一次頻道首頁(yè)改版,則更難判斷了。
因此,我們可以采用漏斗分析法來(lái)確定用戶流失路徑:用戶從進(jìn)入頻道,到閱讀書(shū)籍,到書(shū)豆付費(fèi),到離開(kāi)頁(yè)面所有的操作步驟羅列出來(lái),從入口到出口把所有的流程整理成一個(gè)分析漏斗,針對(duì)每個(gè)節(jié)點(diǎn)采集關(guān)鍵因素?cái)?shù)據(jù),分析哪一步操作上出現(xiàn)了異常,再對(duì)其進(jìn)行優(yōu)化。最后我們發(fā)現(xiàn),由于一個(gè)技術(shù)bug導(dǎo)致支付頁(yè)(問(wèn)題節(jié)點(diǎn))
報(bào)錯(cuò)率偏高,許多用戶在頁(yè)面報(bào)錯(cuò)后直接離開(kāi),因此產(chǎn)生了書(shū)豆減少的情況。
兩張轉(zhuǎn)化率實(shí)例圖向我們展示:通常轉(zhuǎn)化率過(guò)低的節(jié)點(diǎn)就是問(wèn)題節(jié)點(diǎn)。加入購(gòu)物車之前的轉(zhuǎn)化率都較高,但在購(gòu)物付款的流程中,轉(zhuǎn)化率急劇降低至8%,這里可能就是需要改進(jìn)的地方。
類似的分析手法還有很多,以下圖中的「同期群分析」、「留存分析」、「熱力圖分析」、「AB測(cè)試」等等都可以歸納到趨勢(shì),對(duì)比和細(xì)分這三種分析種類中,感興趣的同學(xué)可以自行檢索,我后期文章中也會(huì)詳細(xì)闡述。
第4則- 小結(jié)
「人」這種生物,有時(shí)候連自己,都不知道自己想要的是什么,所以有時(shí)候很難去窺探用戶的心理,數(shù)據(jù)的分析與挖掘則用相對(duì)更科學(xué),概率更大的方法告訴我們他們的真實(shí)意圖。「數(shù)據(jù)」很多時(shí)候已經(jīng)替代了用戶在屏幕前的“聲音”。不管是產(chǎn)品經(jīng)理,數(shù)據(jù)分析師,還是用戶研究員,大家職能的核心,是通過(guò)研究用戶/定義產(chǎn)品來(lái)創(chuàng)造價(jià)值,數(shù)據(jù)分析只是一件工具,掌握一定的分析手法是必要的,切莫沉迷于手法,并不是手法越高級(jí)分析結(jié)果越準(zhǔn)確,「合適」才最重要。這兩天和某度的小伙伴聊天時(shí)她說(shuō)了一點(diǎn),越往深了追求數(shù)據(jù)分析的應(yīng)用,則越容易陷入凡事都要走一套「數(shù)分流」的怪圈,好比明明知道人不吃東西就會(huì)餓死,非要用各種,人類生命周期,天災(zāi)人禍概率,人體代謝機(jī)能等等去證明這一點(diǎn)。對(duì)此我想說(shuō),人是活的,理論是死的,靈活的選擇完成目的的手段,能用10塊辦成的事沒(méi)有必要花100塊。以明確的分析目的為導(dǎo)向,使用最高效且成本最少的分析手段,得出最科學(xué)且最正確的分析結(jié)果,輔助問(wèn)題業(yè)務(wù)的挖掘和優(yōu)化,才是做數(shù)據(jù)分析的終極奧義。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫(kù)操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問(wèn)題時(shí)有發(fā)生。 ...
2025-07-14如何考取數(shù)據(jù)分析師證書(shū):以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開(kāi)啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書(shū)) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07