
作者 | 數(shù)據(jù)海洋
來源 | haiyangxinyong
很多從事數(shù)據(jù)分析的同事都以為數(shù)據(jù)分析師,應(yīng)該是通過數(shù)據(jù)對業(yè)務(wù)團(tuán)隊(duì)決策、公司管理層的決策進(jìn)行“指點(diǎn)江山”。在實(shí)際工作內(nèi)容應(yīng)該是做數(shù)據(jù)分析報(bào)告;構(gòu)建機(jī)器學(xué)習(xí)模型;打造數(shù)據(jù)產(chǎn)品,做的都是非常有“技術(shù)含量”的活。
舉個場景,業(yè)務(wù)團(tuán)隊(duì)要做一場促銷。數(shù)據(jù)分析師理想狀態(tài)應(yīng)該這樣:
這是很多數(shù)據(jù)分析師認(rèn)為應(yīng)該的工作狀況,當(dāng)然這也是大多數(shù)數(shù)據(jù)分析師的夢想狀態(tài),因?yàn)橄窈芏啻蠊局械臄?shù)據(jù)分析師的確是在實(shí)踐著這個“夢想”。而不是活動前、后都只是叫數(shù)據(jù)分析師提個數(shù)據(jù),做個報(bào)表。
經(jīng)驗(yàn)小提示:
上述案例場景通過數(shù)據(jù)分析發(fā)現(xiàn)機(jī)會點(diǎn)指導(dǎo)業(yè)務(wù)進(jìn)行精準(zhǔn)營銷,的確應(yīng)該是數(shù)據(jù)分析師價值最重要體現(xiàn)之一,但要實(shí)現(xiàn)這個場景,需要企業(yè)數(shù)據(jù)文化、公司的數(shù)據(jù)質(zhì)量、公司的業(yè)務(wù)規(guī)模、公司的數(shù)據(jù)團(tuán)隊(duì)能力……
“理想很豐滿,現(xiàn)實(shí)很骨感!”很多數(shù)據(jù)分析師在實(shí)際從事數(shù)據(jù)分析師工作卻發(fā)現(xiàn),自己都只是在從事著數(shù)據(jù)需求和數(shù)據(jù)報(bào)表這二塊內(nèi)容。這是很多數(shù)據(jù)分析師從事“數(shù)據(jù)分析師”一段時間后都會面臨的困惑,感覺自己就是一個取數(shù)工具,一個是提報(bào)表需求的人,對這個職業(yè)失去了信心。
但反過來想想,如果這二個基礎(chǔ)做不好,后續(xù)“高大上”“有技術(shù)含量”的事情也是做不好的。我個人認(rèn)為:如果這二塊基礎(chǔ)做不好,可能你也沒有時間深入理解業(yè)務(wù),即便理解可能是比較粗與淺,是很難做出一份高質(zhì)量的數(shù)據(jù)分析報(bào)告的。
很多朋友寫的數(shù)據(jù)分析報(bào)告,往往都在羅列數(shù)據(jù),感覺PPT做的很多圖表,很多數(shù)據(jù),但是你問問他你這份報(bào)告的結(jié)論是什么,支持結(jié)論的數(shù)據(jù)是什么,這份數(shù)據(jù)分析報(bào)告應(yīng)該針對誰?可能就……
經(jīng)驗(yàn)小分享:
數(shù)據(jù)分析師的工作根據(jù)公司規(guī)模,公司所處階段、數(shù)據(jù)分析師工作經(jīng)驗(yàn)、數(shù)據(jù)分析團(tuán)隊(duì)的架構(gòu)與定位,數(shù)據(jù)分析師工作內(nèi)容會有不同的側(cè)重點(diǎn)。
在前面的一篇文章中,我放了一個下面的一張圖,把數(shù)據(jù)分析師工作內(nèi)容可以分成以下幾塊:
數(shù)據(jù)分析師工作如果從“價值體現(xiàn)”來看,我劃分成二個階段,這個價值體現(xiàn)請各位同學(xué)記錄,一定沒有高低之分,只是公司在不同階段和具體場景需要的數(shù)據(jù)價值去匹配,只有適應(yīng)與不適應(yīng)之分:
1)看事實(shí)數(shù)據(jù)發(fā)現(xiàn)問題
通過準(zhǔn)確、及時、完整的、相對客觀的數(shù)據(jù)指標(biāo)與數(shù)據(jù)體系來:監(jiān)控業(yè)務(wù)狀況,定位業(yè)務(wù)問題點(diǎn)。我隨時隨地知道我業(yè)務(wù)進(jìn)度,業(yè)務(wù)是否有異常,根據(jù)我需要的常用維度進(jìn)行拆解。
銷售額,我知道KPI完成進(jìn)度VS時間進(jìn)度,一個維度:按品類拆分的進(jìn)度;知道誰好誰壞;一個維度:按客流、客單拆分,知道是哪個因素導(dǎo)致;一個維度:可能按門店拆分,看哪個門店、哪個區(qū)域有問題。請牢牢見一個原則,如果你的拆分維度后的數(shù)據(jù)指標(biāo)沒有人為這個負(fù)責(zé),找不到責(zé)任人那還是不用這個維度。能達(dá)到這樣的數(shù)據(jù)狀態(tài)企業(yè)非常非常少。真的,真的,真的。特別是傳統(tǒng)的企業(yè),互聯(lián)網(wǎng)類型的可能好點(diǎn)。
2)挖掘數(shù)據(jù)價值找到問題答案
這個階段更多是“洞察”,對數(shù)據(jù)進(jìn)行深入的分析,“數(shù)據(jù)分析商業(yè)洞察”,挖掘出隱藏在數(shù)據(jù)背后的規(guī)律,從而支持各種商業(yè)決策。在實(shí)際工作中,根據(jù)具體的業(yè)務(wù)場景可能會需要不同的數(shù)據(jù)分析方法,例如:做用戶的分類,可能會做一個“顧客聚類”模型,對用戶流失可能會做一個用戶流失預(yù)測模型。但千萬記住,核心是“解決問題”,核心不是“技術(shù)含量,技術(shù)復(fù)雜度,用什么工具”。
準(zhǔn)備從事數(shù)據(jù)分析師及剛從事數(shù)據(jù)分析師的同學(xué)一定要記住。最怕那種不懂裝懂,上來說問你處理過多大數(shù)據(jù)量,你做過多個機(jī)器學(xué)習(xí)模型,你做過多少個數(shù)據(jù)產(chǎn)品!沒有做過這些內(nèi)容,好像數(shù)據(jù)分析就沒有任何價值。
我們舉個場景來說明這二種價值的體現(xiàn)。某個企業(yè),某周業(yè)務(wù)團(tuán)隊(duì)發(fā)現(xiàn)本周銷售額發(fā)現(xiàn)沒有達(dá)到之前設(shè)置的目標(biāo),假設(shè)是月累計(jì)完成率。我們假設(shè)有二種數(shù)據(jù)分析場景:
1)通過數(shù)據(jù)拆解定位是某個區(qū)域的銷售遠(yuǎn)低于目標(biāo)
那數(shù)據(jù)分析師如果對業(yè)務(wù)很理解,可以會假設(shè)各種原因。例如:是否缺貨,是否競爭對手搞活動,是否取消與第三方的合作,是否定價過高,是否服務(wù)質(zhì)量下降,是否促銷效果不好,是否商品品質(zhì)不好、是否客流下降、是否客單下降……. 會形成各種商業(yè)場景問題的原因假設(shè),基于各種假設(shè)來利用進(jìn)行驗(yàn)證分析。
當(dāng)然如果對業(yè)務(wù)不熟悉,也可以通過對各種數(shù)據(jù)相關(guān)指標(biāo)來進(jìn)行對比,找到可能影響的關(guān)鍵因素。例如:如果客流下降,是否某個價格帶的商品太少,或者缺少引流品牌,是否缺少足夠多的引流商品。一般是通過把當(dāng)前的數(shù)據(jù)與這個區(qū)域的歷史數(shù)據(jù)縱向?qū)Ρ确治?;與其它區(qū)域的橫向?qū)Ρ冗M(jìn)行分析發(fā)現(xiàn)。
2)如果是所有區(qū)域都下降,而且下降幅度相差不會太大
可能就是公司整體商品策略、價格策略、促銷策略,或者整體的社會環(huán)境導(dǎo)致用戶的購買力下降。形成相關(guān)假設(shè)后,一樣用數(shù)據(jù)去驗(yàn)證這個假設(shè)。假設(shè)銷售的下降,是由于某類型顧客流失率在持續(xù)上升導(dǎo)致。那業(yè)務(wù)需要針對這類企業(yè)進(jìn)行針對性營銷動作以做挽回。這個時間可能需要“機(jī)器學(xué)習(xí)”這種有“技術(shù)含量”來支持:
①構(gòu)建機(jī)器學(xué)習(xí)模型
這個時候可能構(gòu)建機(jī)器學(xué)習(xí)的預(yù)測模型,為每位顧客的流失概率打上標(biāo)簽,根據(jù)流失概率來提前做預(yù)測。
小提示:一個顧客如果已經(jīng)流失了,挽回的可能性一般是很小的,或者要挽回的代價很高。對于用戶購買相對高頻商品的公司來說,一般都會對流失用戶提前預(yù)測。
當(dāng)然,也可以通過數(shù)據(jù)分析,尋找找到幾個關(guān)鍵數(shù)據(jù)指標(biāo)來劃分,這時候針對是一類型的顧客,而不是一個顧客。也一樣可以提升營銷的效率。
二種都是解決問題的方法與工具;都是能解決問題,在精細(xì)度上有一定區(qū)別,但前面一種“成本”也比較高,我們數(shù)據(jù)分析師也一定要商業(yè)最重要一個指標(biāo)的衡量:ROI。所以根據(jù)實(shí)際情況和資源來決定用什么方法。
②構(gòu)建智能營銷數(shù)據(jù)產(chǎn)品
對每個用戶有各種根據(jù)數(shù)據(jù)分析生成的標(biāo)簽,例如:價格帶偏好、品牌偏好、購物時間偏好、購買金額偏好,高價值標(biāo)簽,活躍度標(biāo)簽等;也會有各種機(jī)器學(xué)習(xí)模型構(gòu)建的標(biāo)簽,例如:通過不同的場景的聚類,打上相應(yīng)的標(biāo)簽,像生命周期標(biāo)簽;對用戶的流失概率建模,打上流失概率標(biāo)簽等。
利用數(shù)據(jù)內(nèi)容,業(yè)務(wù)可以設(shè)置一個規(guī)則,系統(tǒng)可以每天定時計(jì)算,也可以用戶產(chǎn)生新數(shù)據(jù)后實(shí)時計(jì)算,從而更新用戶的標(biāo)簽或者各種概率值。當(dāng)用戶滿足某個值的時候,自動促銷哪種類型的營銷手段,以哪些觸達(dá)方式促銷用戶。
會員或者活動運(yùn)營的同學(xué)可以及時看到各種報(bào)表統(tǒng)計(jì)數(shù)據(jù)來看營銷效果:數(shù)據(jù)分析師可以不斷的迭代機(jī)器學(xué)習(xí)模型,用新的數(shù)據(jù)不斷持續(xù)優(yōu)化模型,提升預(yù)測準(zhǔn)確度。
業(yè)務(wù)同學(xué)可以營銷效果結(jié)合相應(yīng)的數(shù)據(jù)分析結(jié)果,不斷的迭代與優(yōu)化對應(yīng)的營銷方式。數(shù)據(jù)分析師,從職業(yè)發(fā)展來看,隨時發(fā)展可以走技術(shù)路線:機(jī)器學(xué)習(xí)、數(shù)據(jù)產(chǎn)品方向;或商業(yè)分析方向!
小經(jīng)驗(yàn)總結(jié):
數(shù)據(jù)分析核心還是要懂業(yè)務(wù),懂商業(yè)邏輯。用“假設(shè)檢驗(yàn)”的思維去做數(shù)據(jù)分析,往往是一個優(yōu)秀的數(shù)據(jù)分析師的最重要的“特長”。個人觀點(diǎn):這個特長可能是書上學(xué)不來了,他還真的靠自己不斷的實(shí)踐,不斷的問為什么形成的。包括我寫的文章,只能幫助大家更好的理解,打個認(rèn)知。同時有一些小經(jīng)驗(yàn)分享,少轉(zhuǎn)一點(diǎn)點(diǎn)彎路。
把基礎(chǔ)數(shù)據(jù)工作做好往往是深入理解商業(yè)邏輯中重要的方式,基礎(chǔ)做好的,才能做數(shù)據(jù)分析這種相對高大上的內(nèi)容真正做好。
看事實(shí)數(shù)據(jù),是基礎(chǔ),是核心,也是關(guān)鍵:
我把數(shù)據(jù)臨時需求、數(shù)據(jù)報(bào)表這二個部分的價值更多在于“看事實(shí)數(shù)據(jù)”。這二個內(nèi)容提供好后,對業(yè)務(wù)價值是:看數(shù)據(jù),通過數(shù)據(jù)直觀、清晰了解業(yè)務(wù)實(shí)際情況,是否有異常,如果有異常,業(yè)務(wù)異常發(fā)生在哪,從而可以快速做出相應(yīng)的商業(yè)動作。
為什么叫“事實(shí)數(shù)據(jù)”還事實(shí)包括二個含義:
一個是數(shù)據(jù)是正確統(tǒng)計(jì)。
是指在數(shù)據(jù)統(tǒng)計(jì)過程中,“數(shù)據(jù)代碼的開發(fā)與實(shí)現(xiàn)”是正確的,沒有統(tǒng)計(jì)錯。例如:銷售金額,不會統(tǒng)計(jì)成銷售數(shù)量,因?yàn)閿?shù)據(jù)表、數(shù)據(jù)字段用錯,寫SQL代碼邏輯寫錯;這種更多是避免“技術(shù)”上的錯誤導(dǎo)致數(shù)據(jù)不準(zhǔn)確。
一個是是指數(shù)據(jù)指標(biāo)定義是符合要分析場景,沒有被“人為修飾”過。
數(shù)據(jù)的加工是根據(jù)特定場景,按實(shí)際需要進(jìn)行定義的。數(shù)據(jù)反應(yīng)真實(shí)的業(yè)務(wù)狀況,業(yè)務(wù)表現(xiàn)。通過一個例子來說明一下:轉(zhuǎn)化率=訂單量/UV;還是會員數(shù)/UV;
1)應(yīng)該是用訂單量還是會員數(shù),應(yīng)該用什么狀態(tài)的數(shù)據(jù):創(chuàng)建產(chǎn)生的訂單/會員,支付產(chǎn)生的訂單/會員,還是支付成功的訂單/會員;
2)UV是指訪客,訪客是按cookie統(tǒng)計(jì),還是按用戶的設(shè)備號統(tǒng)計(jì)。數(shù)據(jù)指標(biāo)定義實(shí)現(xiàn)沒有所謂的“百分之百”的準(zhǔn)確,在特定場景下根據(jù)數(shù)據(jù)要反饋或者分析的特定問題,我們應(yīng)該使用更真實(shí)的數(shù)據(jù)指標(biāo)。就我們上面的轉(zhuǎn)化率,如果匯報(bào)的同學(xué)想表達(dá)“特定”觀點(diǎn),可以會針對性定義某應(yīng)的數(shù)據(jù)指標(biāo)。而不是根據(jù)相對“客觀”真實(shí)反饋數(shù)據(jù)的話,可能呈現(xiàn)的數(shù)據(jù)指標(biāo)會出現(xiàn)截然不同的二個結(jié)論。
有時候會聽到說,“數(shù)據(jù)會撒謊”,數(shù)據(jù)本不會撒謊,但是就看用的或者加工數(shù)據(jù)的人怎么處理了;數(shù)據(jù)是用來反映問題,幫助解決問題,不應(yīng)該讓數(shù)據(jù)成為掩飾問題的手段。
經(jīng)驗(yàn)小分享:
一、應(yīng)該讓業(yè)務(wù)看到真實(shí)數(shù)據(jù),保證數(shù)據(jù)一致,各個出口看到的數(shù)據(jù)指標(biāo)不打架,至少應(yīng)該是關(guān)鍵數(shù)據(jù)指標(biāo)像KPI不打架。這種關(guān)鍵指標(biāo)應(yīng)該是定義好,不允許更改,如果要更改也必須是管理層來確定。
二、在實(shí)際很多企業(yè)中,能做好數(shù)據(jù)臨時需求、數(shù)據(jù)報(bào)表構(gòu)建好,已經(jīng)能解決企業(yè)很大的問題,對任何業(yè)務(wù)團(tuán)隊(duì)的來說,可以準(zhǔn)確、及時、完整的看到數(shù)據(jù),通過數(shù)據(jù)可以很好的看清楚業(yè)務(wù)狀況,業(yè)務(wù)結(jié)構(gòu)。
“通過數(shù)據(jù),可以很直觀反饋業(yè)務(wù)是否健康,是否有異常,利用數(shù)據(jù)可以快速的監(jiān)控、定位業(yè)務(wù)的健康狀況?!薄皫椭鷺I(yè)務(wù)團(tuán)隊(duì)做決定,最重要搞清楚問題是什么,什么是最為重要的。如果問題都還沒有搞清楚,定義清楚,憑感覺就簡單的做出各種決策。這是“拍腦袋行為”,在目前競爭環(huán)境下,已經(jīng)不再適應(yīng)!”
當(dāng)前面這些基礎(chǔ)做好后,才有可能去談,如何做數(shù)據(jù)分析。因?yàn)樽鰯?shù)據(jù)分析最大的前提是要清楚定義問題;下篇文章我們再來談?wù)剶?shù)據(jù)分析。期待與大家進(jìn)一步探討。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10