
作者 | 數(shù)據(jù)海洋
來源 | haiyangxinyong
一名數(shù)據(jù)分析師不管在什么行業(yè),在什么類型的企業(yè)任職,把服務(wù)公司的業(yè)務(wù)流程、業(yè)務(wù)邏輯、業(yè)務(wù)與數(shù)據(jù)對(duì)應(yīng)起來這是基礎(chǔ)的基礎(chǔ)。在這個(gè)前提下,通過我業(yè)務(wù)方的溝通與交流,你應(yīng)該要了解的信息,在時(shí)間維度上,可能是未來1個(gè)月,3個(gè)月,6個(gè)月或者12個(gè)月:
了解信息后,以KPI具體數(shù)值的為例:數(shù)據(jù)分析師可以多問自己幾個(gè)為什么,然后再和業(yè)務(wù)溝通你的理解,你才有可能真正理解KPI背后的邏輯與原因。業(yè)務(wù)包括:
很多數(shù)據(jù)分析師其實(shí)都不愿意或者認(rèn)為去了解和理解這些內(nèi)容不重要,或者感覺和自己做的事情無關(guān)。數(shù)據(jù)分析師從做的內(nèi)容來說,可以分成以下幾個(gè)層次,每次層次的內(nèi)容和分析師所處的階段和數(shù)據(jù)分析師資歷有關(guān)系。
數(shù)據(jù)需求處理
所謂有數(shù)據(jù)需求,就是業(yè)務(wù)團(tuán)隊(duì)根據(jù)業(yè)務(wù)需要。向你提出的希望分析師能從數(shù)據(jù)庫中提取的數(shù)據(jù)內(nèi)容。例如:本月做了一個(gè)促銷活動(dòng),想知道促銷活動(dòng)帶來了多少新客、顧客,同時(shí)想看一下,老客戶從過去某段時(shí)間內(nèi)累計(jì)消費(fèi)的頻次分布。業(yè)務(wù)基于得到的數(shù)據(jù)進(jìn)行活動(dòng)總結(jié),來分析這次活動(dòng)是否達(dá)到預(yù)期。
在一些業(yè)務(wù)快速發(fā)展的企業(yè),數(shù)據(jù)需求處理往往占據(jù)了數(shù)據(jù)分析師非常大的工作量。對(duì)于初級(jí)數(shù)據(jù)分析師來說,可能占據(jù)了他們80%左右的工作時(shí)間。
很多數(shù)據(jù)分析師發(fā)現(xiàn),特別是初級(jí)數(shù)據(jù)分析師在工作一段時(shí)間后。天天都是拉數(shù)據(jù),處理為完的數(shù)據(jù)需求;公司的大數(shù)據(jù)平臺(tái)或者數(shù)據(jù)倉庫建設(shè)不是那么完善,數(shù)據(jù)提取效率比較低。
有時(shí)候因?yàn)閿?shù)據(jù)底層的問題,導(dǎo)致提取數(shù)據(jù)的時(shí)候,可能用的表不一樣,導(dǎo)致數(shù)據(jù)取錯(cuò)誤的數(shù)據(jù)。數(shù)據(jù)倉庫底層往往表非常多,1千多張是很正常的。很多公司的數(shù)據(jù)開發(fā)/治理不是那么好,導(dǎo)致表的生命周期管理不是很好。經(jīng)常對(duì)不常用的表可能會(huì)使用錯(cuò)誤。
往往抱怨,數(shù)據(jù)分析師好像非常沒有“技術(shù)”含量。但在我個(gè)人認(rèn)為,這往往是最有“技術(shù)”含量的,數(shù)據(jù)需求往往是幫助一個(gè)數(shù)據(jù)分析師,去理解業(yè)務(wù),理解業(yè)務(wù)痛點(diǎn),和業(yè)務(wù)建立緊密關(guān)系的最重要的場(chǎng)景。
當(dāng)我還是一個(gè)初級(jí)數(shù)據(jù)分析師的時(shí)候:
在處理前:
在收到業(yè)務(wù)數(shù)據(jù)需求的時(shí)候,我往往都會(huì)去思考,給自己提幾個(gè)問題:
為什么要提這個(gè)需求?
業(yè)務(wù)中是誰真正會(huì)用這個(gè)數(shù)據(jù)?
要解決的問題是什么?
用這些數(shù)據(jù)能不能真正解決業(yè)務(wù)的問題?
在處理后:
當(dāng)我給出數(shù)據(jù)需求的時(shí)候,一般我會(huì)把每個(gè)數(shù)據(jù)的口徑說明清楚,對(duì)自己給出的數(shù)據(jù)做出檢查。很多時(shí)候我會(huì)根據(jù)我的理解,再對(duì)這個(gè)需求提供多一些數(shù)據(jù)內(nèi)容,幫助他可能要做進(jìn)一步的數(shù)據(jù)分析。
對(duì)應(yīng)數(shù)據(jù)需求的代碼,我們做一下歸檔。往往很多時(shí)候,很多業(yè)務(wù)的數(shù)據(jù)需求都是會(huì)重復(fù)的或者相差不大,用寫的代代碼修改提取數(shù)據(jù),速度要快很多。
在處理數(shù)據(jù)需求過程中,會(huì)和業(yè)務(wù)溝通確定一下數(shù)據(jù)口徑,也一起問一下為什么會(huì)需要這個(gè)需求,如果態(tài)度比較好,一般業(yè)務(wù)同學(xué)都很愿意和你分享。通過與數(shù)據(jù)需求建立聯(lián)系后,有空可以和業(yè)務(wù)一起吃吃飯,交流交流,會(huì)讓你更清楚業(yè)務(wù)情況,這樣你也更好的知道應(yīng)該如何提供數(shù)據(jù)服務(wù),誰需要用相關(guān)數(shù)據(jù)來干什么。“數(shù)據(jù)需求是理解業(yè)務(wù)問題與痛點(diǎn),與業(yè)務(wù)伙伴建立溝通的橋梁”
經(jīng)驗(yàn)分享:
在業(yè)務(wù)比較理解,數(shù)據(jù)比較熟悉后,我處理數(shù)據(jù)需求的時(shí)候,往往我會(huì)在理解完數(shù)據(jù)需求的基礎(chǔ),主動(dòng)和業(yè)務(wù)做一次溝通,一般是說我們一起確定數(shù)據(jù)口徑。然后對(duì)數(shù)據(jù)需求中的數(shù)據(jù)口徑,時(shí)間范圍作一個(gè)討論,通過確定數(shù)據(jù)需求。也順便了解一下業(yè)務(wù)。
很多同行會(huì)說,有時(shí)候很忙,沒有時(shí)候確定。其實(shí),如果你自己有理解清楚需求再加上溝通數(shù)據(jù)需求,對(duì)你后續(xù)數(shù)據(jù)需求處理效率,以及避免需求處理反工有很大幫助。
小觀點(diǎn)viewpoint 如果你所有公司有非常多的各種臨時(shí)需求,一方面:一般說明公司業(yè)務(wù)還在發(fā)展或者變化中,很需要數(shù)據(jù)來支持和幫助。另一方面:如果你不能很好的響應(yīng)與處理需求,對(duì)你來說是個(gè)壞事,你會(huì)天天認(rèn)為自己的工作就是在處理需求,天天都在寫SQL代碼,沒有什么價(jià)值。
數(shù)據(jù)分析師在處理數(shù)據(jù)需求的同時(shí),必然都是各種數(shù)據(jù)報(bào)表的需求。各個(gè)開發(fā)或者設(shè)計(jì)過報(bào)表開發(fā)的數(shù)據(jù)分析師,有沒有思考過這些問題:
經(jīng)驗(yàn)分享:
一個(gè)好的數(shù)據(jù)分析師,往往都有一顆“好奇心”。往往對(duì)任何事情都會(huì)有很多為什么?對(duì)一個(gè)數(shù)據(jù)背后,數(shù)據(jù)分析師和普通人的思維可能會(huì)不一樣。同樣看到某個(gè)報(bào)道上,某個(gè)城市人均月收入破8千,你的感覺是什么?好奇的數(shù)據(jù)分析師可以會(huì)問以下問題:
基于這些進(jìn)一步的數(shù)據(jù)后,才能對(duì)這些數(shù)據(jù)背后的東西做判斷。所以在設(shè)計(jì)報(bào)表的時(shí)候就要基于業(yè)務(wù)場(chǎng)景,來思考要用什么樣的數(shù)據(jù)來幫助業(yè)務(wù)做出更正的判斷。
數(shù)據(jù)報(bào)表設(shè)計(jì)
在設(shè)計(jì)報(bào)表的時(shí)候經(jīng)驗(yàn)總結(jié)來看,可以不斷問以幾個(gè)問題,從而可以幫助更好的把數(shù)據(jù)報(bào)表設(shè)計(jì)好:
什么時(shí)候應(yīng)該開發(fā)數(shù)據(jù)報(bào)表提供給業(yè)務(wù)團(tuán)隊(duì)使用。當(dāng)業(yè)務(wù)提出要開發(fā)數(shù)據(jù)報(bào)表的時(shí)候,數(shù)據(jù)分析師應(yīng)該有基于業(yè)務(wù)知識(shí)的基礎(chǔ)上進(jìn)行判斷。正常應(yīng)該在二種情況下比較適合開發(fā)數(shù)據(jù)報(bào)表:
經(jīng)驗(yàn)分享:收到報(bào)表需求后,數(shù)據(jù)分析師應(yīng)該先有判斷。并不應(yīng)該是收到數(shù)據(jù)需求后,立即就為開發(fā)數(shù)據(jù)報(bào)表做準(zhǔn)備,多分析這個(gè)數(shù)據(jù)報(bào)表需求,從業(yè)務(wù)穩(wěn)定性、數(shù)據(jù)需求頻率等角度考慮。如果不開發(fā)成數(shù)據(jù)報(bào)表,可以提供其它方式滿足業(yè)務(wù)。
小結(jié)
一個(gè)數(shù)據(jù)分析師,如果可以把數(shù)據(jù)報(bào)表設(shè)計(jì)好,數(shù)據(jù)需求處理好,對(duì)于業(yè)務(wù)來說,滿足了業(yè)務(wù)基礎(chǔ)的數(shù)據(jù)服務(wù),為業(yè)務(wù)基于數(shù)據(jù)對(duì)業(yè)務(wù)異常的定位、監(jiān)控。
當(dāng)發(fā)現(xiàn)業(yè)務(wù)KPI數(shù)據(jù)指標(biāo)不好,我們定位好問題在哪發(fā)生?接下來應(yīng)該要回答的,解決怎么問題,怎么辦?就需要我們開始針對(duì)具體的業(yè)務(wù)問題,和業(yè)務(wù)場(chǎng)景進(jìn)行專項(xiàng)的數(shù)據(jù)分析。下一篇我們一起來探討,如何開展一個(gè)數(shù)據(jù)分析。
如果您是以下幾種情況之一:
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10