
數(shù)據(jù)分析師,少一點(diǎn)套路,多一點(diǎn)思路
數(shù)據(jù)分析師在如今大數(shù)據(jù)時(shí)代有著舉足輕重的地位。一個(gè)出色的數(shù)據(jù)分析師是能夠通過(guò)自身對(duì)公司業(yè)務(wù)的理解,為各個(gè)層面提供有效,可靠的信息,并對(duì)其進(jìn)行評(píng)價(jià)和預(yù)測(cè)。
作為一名數(shù)據(jù)分析師,了解公司業(yè)務(wù)是關(guān)鍵。分析師不是單純地把公司各部門(mén)對(duì)數(shù)據(jù)的需求展示出來(lái),而是更有前瞻性的思考提出這些需求的原因。除了他們提出需要的需求外,還有哪些相關(guān)的數(shù)據(jù)信息能夠幫助他們理解、衡量業(yè)務(wù)。
我曾在大數(shù)據(jù)廣告公司分析部門(mén)工作過(guò),我們的做法一般是,需求部門(mén)提出需求,然后與分析師通過(guò)一到兩次的會(huì)議,對(duì)需求目的,以及報(bào)表的展現(xiàn)形式達(dá)成一致。接著分析師用SQL在數(shù)據(jù)庫(kù)讀取數(shù)據(jù),或?qū)懸恍┳詣?dòng)化程序完成數(shù)據(jù)的收集,最后用可視化軟件制作報(bào)表。 但是我們常常發(fā)現(xiàn),當(dāng)這些部門(mén)的stackholder看了報(bào)表后,往往會(huì)提出其它的額外要求,比如再多加幾個(gè)維度,比如再原有的報(bào)表上建立一張細(xì)顆粒度更細(xì)的表,等等。
1、這種情況經(jīng)常發(fā)生,產(chǎn)生這種情況的原因有以下幾種
1)提出需求的人在一開(kāi)始并沒(méi)有非常明確的需求。他可能在提出需求時(shí),僅僅只考慮了一個(gè)因素,但是忽略了其它因素。
2)在看到分析師制作完成的報(bào)表后,給了需求方更多的啟發(fā)。
3)提出報(bào)表需求的人可能對(duì)數(shù)據(jù),對(duì)業(yè)務(wù)完全沒(méi)有理解。
2、為了避免這些情況發(fā)生,作為一名有經(jīng)驗(yàn)的分析師會(huì)如何處理呢?
1)加強(qiáng)對(duì)業(yè)務(wù)的理解。一個(gè)優(yōu)秀的數(shù)據(jù)分析師,不僅需要懂如何寫(xiě)SQL,和編程語(yǔ)言,還必須懂運(yùn)營(yíng),懂財(cái)務(wù)。曾經(jīng)公司財(cái)務(wù)部找我制作一張關(guān)于ROI的報(bào)表,他們只是很簡(jiǎn)單的描述了一下需求,然后給我很大的自由度讓我發(fā)揮。其實(shí)對(duì)于模糊需求是對(duì)分析師最大的考驗(yàn),在制作這張報(bào)表過(guò)程中,你除了需要了解數(shù)據(jù)庫(kù)各個(gè)表的關(guān)系,在數(shù)據(jù)庫(kù)中拿到準(zhǔn)確的數(shù)值外,你必須還需要了解公司財(cái)務(wù)和運(yùn)營(yíng)上的業(yè)務(wù)。在廣告行業(yè),通常有第一方數(shù)據(jù)和第三方數(shù)據(jù),這兩方的數(shù)據(jù)都能構(gòu)建一個(gè)ROI的表,在思考用戶(hù)需求時(shí)候,我同時(shí)也在思考是否這些數(shù)據(jù)是否能夠幫助他們更清晰的了解他們的需求,或者他們會(huì)不會(huì)之后再提出額外的需求。提前思考的好處在于,在展示報(bào)表給stakeholder看時(shí),你加入了更多對(duì)他們更有用的信息,一來(lái)幫助他們進(jìn)一步了解業(yè)務(wù),二來(lái)增加需求方對(duì)分析師的信任。 同時(shí)你對(duì)他們之后再提出的其它需求也胸有成竹,因?yàn)槟阍谒麄兿氲街耙呀?jīng)考慮到了,避免了來(lái)回去數(shù)據(jù)庫(kù)取數(shù)據(jù),重新制作報(bào)表的情況發(fā)生。
2)對(duì)分析工作的技術(shù)實(shí)施難度,所需時(shí)間的準(zhǔn)確預(yù)測(cè)。在需求方提出問(wèn)題時(shí),分析師必須有能力對(duì)需求的難點(diǎn),可行性,所需時(shí)間有一個(gè)正確的評(píng)估。有些看似容易的需求,但實(shí)施起來(lái)卻相當(dāng)?shù)牟灰祝缡占瘮?shù)據(jù)上的難度,或者可視化制作上的難度。有些問(wèn)題幾分鐘就能解決,但有些看似非常小的需求,可能需要花費(fèi)一天或者更長(zhǎng)的時(shí)間去完成。比如在可視化制作過(guò)程中,經(jīng)常因?yàn)橐粋€(gè)小需求,而花費(fèi)一整天的時(shí)間在網(wǎng)上搜索它的做法。最后不得不告知需求方,可能時(shí)間會(huì)延長(zhǎng),或需求不可行。這時(shí)需求方會(huì)認(rèn)為分析師不專(zhuān)業(yè),而分析師覺(jué)得為了解決這么一個(gè)小問(wèn)題,耗費(fèi)了大量的時(shí)間。
再比如,在線(xiàn)廣告公司的 CRM,DSP系統(tǒng),由于內(nèi)部數(shù)據(jù),業(yè)務(wù)的關(guān)系,有些信息并不能在兩個(gè)系統(tǒng)找到相同的對(duì)應(yīng)關(guān)系,或者兩個(gè)系統(tǒng)中的數(shù)據(jù)有多對(duì)一,一對(duì)多的mapping情況,這些都需要分析師對(duì)數(shù)據(jù)庫(kù)有深入的理解。類(lèi)似的還有制造行業(yè)中企業(yè)MES與ERP系統(tǒng)。
3、當(dāng)你已經(jīng)掌握業(yè)務(wù)和技術(shù)對(duì)分析師的要求時(shí),你應(yīng)該開(kāi)始著重對(duì)以下幾點(diǎn)進(jìn)行思考
1)培養(yǎng)自己隨時(shí)document的習(xí)慣。一是對(duì)所有需求和決定都有一個(gè)追溯和記錄。二來(lái)在分析師休假或者休息時(shí),其它同事有個(gè)參考,而不是等著你來(lái)解決問(wèn)題。三是避免需求方再三地更改需求,互相扯皮的情況發(fā)生。
2) 進(jìn)一步提高自己的溝通能力。一個(gè)好的分析師除了能夠滿(mǎn)足需求方提出的問(wèn)題外,還需要有出色的提問(wèn)和引導(dǎo)技巧能夠幫助需求提出者更進(jìn)一步完善自己的需求。有些需求者并不明確自己的需求,他往往希望通過(guò)在和你的溝通中,進(jìn)一步為需求方理清思路,哪些是high proirity,哪些是must have,哪些是nice to have。
3)有能力預(yù)測(cè)需求者的需求,將解決問(wèn)題變?yōu)槿绾伪苊鈫?wèn)題發(fā)生。 相信分析師最頭疼的就是,需求方每天一個(gè)新主意,今天可能只需要5個(gè)數(shù)據(jù),但是第二天又增加了一個(gè),第三天,又提出其它相關(guān)需求。一個(gè)優(yōu)秀的分析師具備預(yù)測(cè)潛在需求的能力,并且在一開(kāi)始就有所準(zhǔn)備。有時(shí)候需求方認(rèn)為很小的添加,而分析師確需要返回到最開(kāi)始的數(shù)據(jù)庫(kù)搜集數(shù)據(jù),有時(shí)還需要對(duì)原始數(shù)據(jù)庫(kù)表格做調(diào)整,工作量不容小視。
4)將繁瑣的人工重復(fù)工作,變?yōu)樽詣?dòng)化實(shí)施,將節(jié)省下來(lái)的時(shí)間,提高并擴(kuò)展自己的分析技能。作為一名優(yōu)秀的分析師,當(dāng)你天天忙著抱怨工作量太大時(shí),你更應(yīng)該做的是,判斷自己的工作性質(zhì),哪些tasks是需要花費(fèi)時(shí)間做的,哪些tasks是可以通過(guò)其它方法解決高效解決的。當(dāng)你意識(shí)到大良重復(fù)的工作將會(huì)發(fā)生或正在發(fā)生時(shí),需要做的是思考如何把重復(fù)勞動(dòng)變?yōu)橐粍谟酪莸墓ぷ鳌?/span>
5)從被動(dòng)制作BI報(bào)表,變?yōu)橹鲃?dòng)定制KPI,并提供戰(zhàn)略方向。當(dāng)一名優(yōu)秀的分析師有了足夠的行業(yè)經(jīng)驗(yàn)后,必須有能力從被動(dòng)的制作報(bào)表,變?yōu)橹鲃?dòng)的搜集各方面信息,結(jié)合內(nèi)部情況(如:公司財(cái)務(wù)情況,長(zhǎng)短期戰(zhàn)略,核心競(jìng)爭(zhēng)力),外部情況(競(jìng)爭(zhēng)對(duì)手,行業(yè)方向等),定制KPI,為公司提供戰(zhàn)略方向。
6) 敏感的商業(yè)嗅覺(jué)。不同的需求那是小需求,但是相同的需求多了,分析師就應(yīng)該考慮的是不是將需求產(chǎn)品化。畢竟現(xiàn)在企業(yè)不缺少做事的人,而是缺少更有行業(yè),商業(yè)經(jīng)驗(yàn)的人才。
將此篇文章獻(xiàn)給將要從事數(shù)據(jù)分析師,或者在數(shù)據(jù)分析行業(yè)中摸爬滾打的你。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話(huà)題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10