
我們?yōu)槭裁匆⒅財(cái)?shù)據(jù)分析,對(duì)此我的想法是:
有效避免拍腦袋、主觀臆想;
為決策提供支撐,更能說(shuō)服人;
通過數(shù)據(jù)分析,可以看到?jīng)Q策的效果、問題以及未來(lái)應(yīng)該如何做。
知乎用戶@綃頁(yè)的答案很簡(jiǎn)單,但卻一語(yǔ)中的:
“知錯(cuò)能改,善莫大焉”——可是錯(cuò)在哪里,數(shù)據(jù)分析告訴你。
“運(yùn)籌帷幄之中,決勝千里之外”——怎么做好“運(yùn)籌”,數(shù)據(jù)分析告訴你。
“以往鑒來(lái),未卜先知”——怎么發(fā)現(xiàn)歷史的規(guī)律以預(yù)測(cè)未來(lái),數(shù)據(jù)分析告訴你。
一般而言,數(shù)據(jù)分析的邏輯是:先梳理一件事的目的、流程和邏輯(實(shí)際上也就是梳理清楚業(yè)務(wù)邏輯),界定出關(guān)鍵用戶行為和數(shù)據(jù),分析數(shù)據(jù)找到問題,思考解決方案。
比如某電商做了一個(gè)專題活動(dòng),但效果卻并不理想,現(xiàn)在需要尋找原因,那么它的邏輯就大致是:首先梳理用戶消費(fèi)流程:專題活動(dòng)頁(yè)面——商品頁(yè)面——下單購(gòu)買,或者是通過搜索/導(dǎo)航——商品頁(yè)面——下單購(gòu)買;然后界定出關(guān)鍵的用戶行為:打開專題頁(yè)或通過搜索導(dǎo)航、進(jìn)入商品頁(yè)面、點(diǎn)擊購(gòu)買、下單等;再然后確認(rèn)是用戶的哪個(gè)行為數(shù)據(jù)是否有異常的地方,也就是找到問題所在;最后就是思考怎樣去解決這個(gè)問題。
在數(shù)據(jù)來(lái)源正確的前提下,數(shù)據(jù)分析的方法可以分為定性分析和定量分析。
定性分析,就是對(duì)事物的性質(zhì)作出判斷,究竟它“是什么”。比如最近某一個(gè)產(chǎn)品的用戶活躍度大幅度提升,而結(jié)合該款產(chǎn)品最近的更新情況可知,用戶活躍度之所以大幅提升是該款產(chǎn)品上線了一個(gè)新功能導(dǎo)致的。
定量分析,是指對(duì)事情的數(shù)量做出統(tǒng)計(jì),衡量它“有多少”。比如產(chǎn)品優(yōu)化了登錄注冊(cè)流程,這一優(yōu)化的效果是怎樣的,帶來(lái)了多少新注冊(cè)用戶,增長(zhǎng)率是多少。
在《增長(zhǎng)黑客》中有一段對(duì)數(shù)據(jù)分析的精彩論述,其中也有提到定性分析和定量分析的關(guān)系:
數(shù)據(jù)分析就是定性分析和定量分析的相互結(jié)合,不斷驗(yàn)證的過程。提出假設(shè)、設(shè)計(jì)方案、分析數(shù)據(jù)、驗(yàn)證或推翻假設(shè),最終抽絲剝繭,逐漸接近真相。數(shù)據(jù)是相互印證的,彼此之間有如通過無(wú)形的網(wǎng)絡(luò)縱橫連接,只需輕輕按動(dòng)其中一個(gè)就會(huì)驅(qū)使另外一個(gè)或一組產(chǎn)生變化。
通過數(shù)據(jù)分析得出的結(jié)論,應(yīng)當(dāng)能反推出其他數(shù)據(jù),或是與其他數(shù)據(jù)分析得出的結(jié)果相一致。例如,假設(shè)某日在線訂餐網(wǎng)站的數(shù)據(jù)量猛升,猜測(cè)與天氣陰雨、用戶窩在辦公室或家中不愿出門有關(guān),那么就應(yīng)當(dāng)去翻查近期之內(nèi)網(wǎng)站在陰雨天期間的訪問數(shù)據(jù),看是否出現(xiàn)了類似的攀升。
就我自己親身工作經(jīng)歷而言,數(shù)據(jù)分析的流程應(yīng)該是:
明確目的——拉取數(shù)據(jù)——處理數(shù)據(jù)——尋找異常點(diǎn)——得出結(jié)論——驗(yàn)證結(jié)論
明確目的:清楚并理解此次分析的目的是什么,比如尋找某地城市的流量銳減的原因,這個(gè)很多時(shí)候是建立在你對(duì)業(yè)務(wù)邏輯/流程的理解,如果不了解的話,你所做的不是數(shù)據(jù)分析,頂多就是個(gè)數(shù)據(jù)整理的工作。而這就要求先確認(rèn)分析維度,包括拉取什么數(shù)據(jù)、核心變量是什么、核心變量是否受到其他外界因素的影響(是否有其他需求上線?能否取到準(zhǔn)確來(lái)源的數(shù)據(jù)?時(shí)間范圍的數(shù)據(jù)是否出現(xiàn)數(shù)據(jù)問題?)
拉取數(shù)據(jù):很多時(shí)候我們需要自己動(dòng)手從數(shù)據(jù)庫(kù)里拉取相關(guān)數(shù)據(jù),在拉取數(shù)據(jù)時(shí),需要注意以下幾點(diǎn):能在數(shù)據(jù)庫(kù)里處理的,就不要拉到excel中處理;語(yǔ)句是否完整:引號(hào)、分號(hào)、group by;條件限制是否準(zhǔn)確:時(shí)間、平臺(tái)、頁(yè)面、類別、是否去重、是否清洗;語(yǔ)句邏輯是否正確;所取時(shí)間段數(shù)據(jù)是否不受外界因素影響等等。
處理數(shù)據(jù):保存拉取出來(lái)的數(shù)據(jù)作為原始數(shù)據(jù),保留相應(yīng)的語(yǔ)句;掌握常用函數(shù)(Vlookup、sum、Average、if、If error);當(dāng)你認(rèn)為所需要做的事情特別繁瑣時(shí),找人問;或者將你的問題清楚表述,然后百度,你要相信,你所遇到的問題別人很有可能早就遇到過。
至于尋找異常點(diǎn)、得出結(jié)論這兩步,則是需要結(jié)合具體的業(yè)務(wù)才能進(jìn)行,而驗(yàn)證結(jié)論,則是需要從其他維度去驗(yàn)證一下結(jié)論的可靠性,我覺得找老大review是最簡(jiǎn)單最暴力的一種方式。
A、如我們所知,對(duì)待數(shù)據(jù)一直以來(lái)都有不同的態(tài)度,有的人做任何決策都希望能夠有數(shù)據(jù)作為支撐,同樣有的人追求的是對(duì)人性的洞察,追求的是對(duì)未來(lái)的預(yù)見。在我的理解范圍內(nèi),這兩者本質(zhì)上并沒有直接對(duì)立的成分在,沒必要將兩者對(duì)立起來(lái),我們唯一要關(guān)注的東西就是實(shí)現(xiàn)目的。在關(guān)注目的/結(jié)果的時(shí)候,我們就會(huì)很清晰的明了,不管是數(shù)據(jù)流還是人性派,都只是手段,清楚目的所在,就不會(huì)輕易因?yàn)閿?shù)據(jù)不好看就放棄某個(gè)決策,也不會(huì)固執(zhí)堅(jiān)持某個(gè)觀點(diǎn)。
B、關(guān)于數(shù)據(jù)敏感:很多人在我面前說(shuō)自己對(duì)數(shù)據(jù)敏感時(shí),我每次都不以為意。因?yàn)槲矣X得數(shù)據(jù)敏感這個(gè)實(shí)際上是個(gè)偽概念,它更多的是一種(多接觸數(shù)據(jù)之后的)結(jié)果,而非能力,尤其不是那種靠天賦的能力。如果非要說(shuō)是一種能力,在我的理解范圍內(nèi),我覺得數(shù)據(jù)敏感是一種建立在對(duì)業(yè)務(wù)足夠理解的前提下,并且可以通過足夠的訓(xùn)練獲得的能力。沒錯(cuò),我想說(shuō)的時(shí)候:不談對(duì)業(yè)務(wù)的理解,只談數(shù)據(jù),我覺得這是在耍流氓。
C、數(shù)據(jù)的根本用途就是提供決策依據(jù),減少不確定性。現(xiàn)在人們的決策,大多數(shù)是靠感覺,靠跟風(fēng),靠個(gè)人經(jīng)驗(yàn),只有很少部分是客觀數(shù)據(jù)分析。數(shù)據(jù),提供了一種更為可靠的決策依據(jù)。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10