
深入淺出之?dāng)?shù)據(jù)分析四步曲
確定
開始分析之前需要拿到足夠的背景信息,更重要的是要和對方一起明確你們共同想要解決的問題/想要驗證的假設(shè),更更重要的是確定交付的內(nèi)容、形式、期限以及可用資源。
未明確確定自己的問題或目標(biāo)就進行數(shù)據(jù)分析就如同為定下目的地就上路旅行一樣。
當(dāng)然你可能會碰到一些有意思的現(xiàn)象,有時還可能盼著能兜來兜去地撞上點好東西,但是,誰會說你將有所發(fā)現(xiàn)。
分析師常常不夠注重自己要解決的問題,他們拋給別人一些信息,借此推卸自己解決問題和建議決策的義務(wù)。
客戶將根據(jù)你的分析作決策,你需要盡量多從他那里了解一些信息,才能確定問題。
你需要摸清對方的心思,才能擬定一個能夠解決問題的分析方案。
對客戶的了解越深,你的分析越有可能派上用場。
1. 將大問題劃分為小問題
你需要將問題劃分為可管理、可解決的組塊。你無法直接回答大問題,但是通過回答從大問題分解出來的小問題,你就能找到大問題的答案。
2. 將數(shù)據(jù)分解為更小的組塊
圖表不會按照你的意愿去設(shè)定,你必須自己提煉出所需要精確答案的相關(guān)因子及量化值。
首先,將原始數(shù)據(jù)轉(zhuǎn)化為匯總數(shù)據(jù)。
然后,找到感興趣的比較對象分解匯總數(shù)據(jù)。
進行有效的比較是數(shù)據(jù)分析的核心。
定性的數(shù)據(jù),比如那些背景信息,你也需要進行分解和提取,然后得到一些基礎(chǔ)假設(shè),用以分析定量數(shù)據(jù)。
認(rèn)真審視之前分解出來的組塊。
審視過程最關(guān)鍵的是,比較。
價格的比較,群體的比較,銷量的比較,競爭者的比較,營銷方案的比較。
然后,你需要堵上自己的信譽,基于比較做出一些假設(shè),然后逐步檢驗自己的假設(shè)。
這個過程,你的心智模型就參與到了這些數(shù)據(jù)中,通過你的解讀賦予數(shù)據(jù)意義。
比如,你基于一些數(shù)據(jù)得出的結(jié)論,圖表,你可以注明是你的判斷。
客戶將根據(jù)你的分析作決策。
你提交給客戶的報告要以得到客戶理解、鼓勵客戶以數(shù)據(jù)位基礎(chǔ)作出明智的決策為重點。
你的報告應(yīng)當(dāng)【簡練】【專業(yè)】【直接了當(dāng)】
報告應(yīng)該說清楚對方的需求,你依據(jù)哪些信息得到哪些結(jié)論,給出建議。
數(shù)據(jù)要能體現(xiàn)市場的情況。
心智模型
你對外界的假設(shè)和你確信的觀點就是你的心智模型。
心智模型決定你的觀察結(jié)果,是你觀察現(xiàn)實的棱鏡。
你無法看到一切,因此你的大腦必須做出選擇,以便集中注意力。
如果你了解自己的心智模型,那么你發(fā)現(xiàn)重點、開發(fā)最相關(guān)最有用的統(tǒng)計模型的可能性越大。
你的統(tǒng)計模型取決于你的心智模型,如果用了錯誤的心智模型,分析就會胎死腹中。
心智模型應(yīng)當(dāng)包括你不了解的因素
只要能明確不確定因素,你就會小心防范并想辦法填補知識空白,繼而提出更好的建議。
考慮不確定因素及盲點會讓人感覺不爽,但回報顯著。
原始數(shù)據(jù)
要保存原始數(shù)據(jù),并習(xí)慣拿處理后的數(shù)據(jù)和原始數(shù)據(jù)進行比較
在密集的數(shù)據(jù)中兜圈子很容易讓人“迷路”,要是你迷失了目標(biāo),忘記了假設(shè),只要集中注意力完成該完成的數(shù)據(jù)處理就能扭轉(zhuǎn)局勢,優(yōu)秀的數(shù)據(jù)分析的根本在于密切關(guān)注需要了解的數(shù)據(jù)。
為一個化妝品公司分析數(shù)據(jù),發(fā)現(xiàn)廣告投入減少,社交網(wǎng)絡(luò)營銷投入增加,但是銷量卻沒有達到預(yù)期,即時降價也沒能影響銷量。給出的建議是重新提高廣告投入,看看是否有效果。 后來看到一則新聞,得知該品牌的該產(chǎn)品在少女消費者群體中已接近飽和,增加廣告投入沒有太大價值。收集更多數(shù)據(jù),重新分析后發(fā)現(xiàn)新的消費群體,老年男子用該產(chǎn)品做剃須后保養(yǎng)。給出的建議是推出針對老年男子須后保養(yǎng)的產(chǎn)品并推廣。
中間經(jīng)歷了【心智模型轉(zhuǎn)變】->【查看不確定范圍】->【重新收集信息再分析】
EX: 您希望銷量提高多少?您覺得我們怎樣才能辦到呢?您覺得銷量提高多少是可行的?目標(biāo)銷量合理么?競爭對手銷量如何?廣告和社交網(wǎng)絡(luò)投入是怎么考慮的?【知道什么】
EX:您對我們的目標(biāo)客戶了解么?目標(biāo)客戶唯一么?銷售渠道如何?【不知道什么】
在分析過程中得到了一些錯誤的、不完整的信息,導(dǎo)致你給出的建議不符合實際。
數(shù)據(jù)分析是為了更好地決策:開始你需要明確你要解決的問題,最后要給出你的專業(yè)建議
所有的數(shù)據(jù)分析師最終都會被打造成能做出更好決策的人才,你要學(xué)的就是在浩如煙海的數(shù)據(jù)中洞察先機,作出更好決策。
總結(jié)
1. 分析之前要明確問題和范圍,要找你的客戶參與進來
2. 分析最重要的是分解,分解問題也分解數(shù)據(jù),
3. 評估最重要的是比較,找到最有價值的比較
4. 評估的過程,你開始把自己已有的知識加入到其中,堵上自己的信譽
5. 分析之后一定要給決策,不要只是呈現(xiàn)一些結(jié)論
6. 覺察你的心智模型,因為它會對你的分析過程形成深刻影響
7. 時刻反思有哪些你默認(rèn)的前提假設(shè)其實是未知或不確定的
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗證損失驟升:機器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11