
數(shù)據(jù)分析師在做數(shù)據(jù)分析,應(yīng)理性的看待數(shù)據(jù)。但是,很多數(shù)據(jù)分析師在做數(shù)據(jù)分析時(shí),是以主觀的思想去看,而非客觀的去分析。下面給數(shù)據(jù)分析師提出5點(diǎn)建議
1.數(shù)據(jù)是有立場(chǎng)的,立場(chǎng)決定解讀
數(shù)據(jù)對(duì)于業(yè)務(wù)來(lái)講既是KPI的衡量標(biāo)桿,又是業(yè)務(wù)的行動(dòng)指南。有立場(chǎng)的數(shù)據(jù)直接影響數(shù)據(jù)解讀,影響著業(yè)務(wù)的行動(dòng)趨勢(shì)。
舉例:假如某次活動(dòng)時(shí)網(wǎng)站的轉(zhuǎn)化率是1.2%,要對(duì)此指標(biāo)做數(shù)據(jù)分析。
數(shù)據(jù)分析的第一步是定性結(jié)果,1.2%的轉(zhuǎn)化率是好還是壞?有比較才能區(qū)分好壞,如何比較呢?常用的比較分析方法有環(huán)比、占比、定基比、橫向比、縱向比等,每一種對(duì)比方法又可以選擇不同的時(shí)間進(jìn)行對(duì)比,如昨日、上周今日、上月今日等。不同的比較方法、不同時(shí)間的對(duì)比結(jié)果可能存在差異甚至是截然相反。如何在符合統(tǒng)計(jì)學(xué)原理的基本前提下做結(jié)果定性呢?
假設(shè)第一步定性工作完成,該活動(dòng)轉(zhuǎn)化率是好的結(jié)果。下一步需要分析為什么好?到底是誰(shuí)的“功勞”?電商網(wǎng)站做大型促銷活動(dòng)時(shí)存在一個(gè)普遍規(guī)律:只要價(jià)格足夠低,無(wú)論用戶體驗(yàn)多差、網(wǎng)站UI多爛、送貨速度多慢、客服態(tài)度多差,這些都不會(huì)影響轉(zhuǎn)化率。這意味著,無(wú)論企業(yè)營(yíng)銷、網(wǎng)站運(yùn)營(yíng)工作效果如何,只要能保證頁(yè)面正常工作,所有節(jié)點(diǎn)的轉(zhuǎn)化率結(jié)果都會(huì)特別好。此時(shí),各個(gè)業(yè)務(wù)節(jié)點(diǎn)對(duì)轉(zhuǎn)化率的影響各占多少權(quán)重?
假設(shè)數(shù)據(jù)分析師排除萬(wàn)難,通過(guò)復(fù)雜的模型算法計(jì)算出各個(gè)業(yè)務(wù)節(jié)點(diǎn)的貢獻(xiàn),作為數(shù)據(jù)分析師,如何跟領(lǐng)導(dǎo)匯報(bào)并解讀各業(yè)務(wù)節(jié)點(diǎn)的真實(shí)貢獻(xiàn),是實(shí)話實(shí)說(shuō)還是含糊其辭,甚至是顛倒是非?
2.數(shù)據(jù)質(zhì)量永遠(yuǎn)是數(shù)據(jù)分析立項(xiàng)后首先要考慮的
做過(guò)大型或?qū)m?xiàng)分析的分析師都有這樣的經(jīng)歷:在經(jīng)過(guò)預(yù)處理、模型建設(shè)、算法調(diào)優(yōu)和分析報(bào)告之后,最后指出報(bào)告中的“亮點(diǎn)”——某個(gè)數(shù)據(jù)節(jié)點(diǎn)效果特別好,數(shù)據(jù)分析師可以考慮加大對(duì)其資源的投入。但業(yè)務(wù)方可能只需要一句話就能讓數(shù)據(jù)分析師瞬間“石化”甚至消除存在感——那是我們和技術(shù)部門所做的測(cè)試數(shù)據(jù)。
導(dǎo)致上述問(wèn)題出現(xiàn)的原因是數(shù)據(jù)分析師在得到數(shù)據(jù)后缺少一個(gè)重要步驟——數(shù)據(jù)質(zhì)量驗(yàn)證。什么是數(shù)據(jù)質(zhì)量驗(yàn)證?
理解數(shù)據(jù)來(lái)源、數(shù)據(jù)統(tǒng)計(jì)和收集邏輯,以及數(shù)據(jù)入庫(kù)處理邏輯;
理解數(shù)據(jù)在數(shù)據(jù)倉(cāng)庫(kù)中存放的細(xì)節(jié),包括字段類型、小數(shù)點(diǎn)位數(shù)、取值范圍、規(guī)則約束等;
明確數(shù)據(jù)的取數(shù)邏輯,尤其是在過(guò)程中是否對(duì)數(shù)據(jù)有轉(zhuǎn)換或重新定義;
第一時(shí)間對(duì)數(shù)據(jù)做數(shù)據(jù)審查,包括數(shù)據(jù)有效性驗(yàn)證、取值范圍、空值和異常值驗(yàn)證,確定其是否與原始數(shù)據(jù)原則一致等。
完成這些工作之后才是數(shù)據(jù)分析。但可惜的是大多數(shù)數(shù)據(jù)分析師都不關(guān)注數(shù)據(jù)質(zhì)量問(wèn)題,甚至對(duì)數(shù)據(jù)的理解僅限于看到數(shù)據(jù)的字面意義。
3.缺乏落地的數(shù)據(jù)是沒(méi)有價(jià)值的
無(wú)論數(shù)據(jù)分析的服務(wù)對(duì)象是具有決策權(quán)的領(lǐng)導(dǎo)層還是執(zhí)行權(quán)的業(yè)務(wù)層,數(shù)據(jù)的價(jià)值永遠(yuǎn)都存在于輔助決策甚至是數(shù)據(jù)驅(qū)動(dòng)中。但部分?jǐn)?shù)據(jù)分析師的數(shù)據(jù)報(bào)告卻讓業(yè)務(wù)方覺(jué)得沒(méi)有價(jià)值:
分析過(guò)程明顯不符合業(yè)務(wù)操作的實(shí)際情況;
結(jié)論明顯是錯(cuò)的;
建議方向性很對(duì),但其實(shí)是人人都知道的大道理,具體執(zhí)行缺乏落地點(diǎn);
建議方向性很明確,也有具體的執(zhí)行建議,但是業(yè)務(wù)不能執(zhí)行。
在以上問(wèn)題中,前兩條問(wèn)題的原因是數(shù)據(jù)分析的基本數(shù)據(jù)能力和業(yè)務(wù)基本常識(shí)不足,這是一定要避免的問(wèn)題;而后兩條問(wèn)題更多是因信息不對(duì)稱而引起的。從數(shù)據(jù)分析師的主觀問(wèn)題分析,根源可能有以下幾方面的內(nèi)容:
數(shù)據(jù)分析師不懂業(yè)務(wù)操作流程,憑自己的理解去猜測(cè)業(yè)務(wù)流程;
數(shù)據(jù)分析師不了解目前業(yè)務(wù)的困難點(diǎn)和緊迫點(diǎn),想要驅(qū)動(dòng)的是業(yè)務(wù)的“次要”關(guān)注點(diǎn);
數(shù)據(jù)分析師不了解業(yè)務(wù)的實(shí)際能力與權(quán)限,尤其是公司大環(huán)境下的實(shí)施制約因素。
4.業(yè)務(wù)應(yīng)用能力和工具應(yīng)用能力都重要,不要迷信算法和模型
受制于教科書的普遍理論,以及企業(yè)對(duì)技術(shù)類崗位的普遍重視,很多數(shù)據(jù)分析師會(huì)過(guò)度關(guān)注算法和模型在數(shù)據(jù)分析過(guò)程中的作用。但其實(shí)在面向業(yè)務(wù)類的實(shí)際工作中,業(yè)務(wù)要的不是多少種算法或模型,而是要面對(duì)業(yè)務(wù)問(wèn)題的解決方案。
舉例:假如我們通過(guò)關(guān)聯(lián)模型分析出不同商品間的交叉購(gòu)買數(shù)據(jù),分析師該如何解釋結(jié)果?
如果分析師這樣解釋:A商品和B商品關(guān)聯(lián)程度較高,從支持度、置信度和提升度來(lái)講效果顯著。由于對(duì)業(yè)務(wù)不理解也不愿意過(guò)多地理解復(fù)雜的算法、模型和指標(biāo)的意義,因此可以預(yù)想到這個(gè)數(shù)據(jù)挖掘的結(jié)果很難落地,數(shù)據(jù)結(jié)果意義很小。
如果分析師這樣解釋:A商品和B商品關(guān)聯(lián)程度較高,意味著用戶通常會(huì)一起購(gòu)買這兩件商品?;谟脩暨@種行為是否可以考慮這樣應(yīng)用,把這兩件商品打包促銷,當(dāng)用戶把A商品加入購(gòu)物車時(shí)推薦B商品?在進(jìn)行活動(dòng)頁(yè)面設(shè)計(jì)時(shí)是否可以將A/B品類、品牌做臨近設(shè)計(jì)以激發(fā)用戶關(guān)聯(lián)購(gòu)買的欲望?這才是業(yè)務(wù)想要的數(shù)據(jù)價(jià)值,無(wú)法與業(yè)務(wù)結(jié)合的數(shù)據(jù)模型只是一堆數(shù)字而已。
5.業(yè)務(wù)需求是數(shù)據(jù)分析的起點(diǎn),但之前需要培養(yǎng)業(yè)務(wù)的數(shù)據(jù)意識(shí)
業(yè)務(wù)需求是數(shù)據(jù)分析的起點(diǎn),很多時(shí)候數(shù)據(jù)分析師在“等”業(yè)務(wù)方提出需求,然后通過(guò)數(shù)據(jù)支撐業(yè)務(wù)方更好地開(kāi)展工作。但實(shí)際情況卻是業(yè)務(wù)方不需要數(shù)據(jù),這種現(xiàn)象既可能是傳統(tǒng)習(xí)慣造成的,也可能是公司文化影響的,甚至可能是個(gè)人因素導(dǎo)致的:
沒(méi)有數(shù)據(jù)決策的意識(shí)。無(wú)論承認(rèn)與否,大多數(shù)業(yè)務(wù)的第一行動(dòng)引導(dǎo)因素還是業(yè)務(wù)經(jīng)驗(yàn),無(wú)論是基于事實(shí)的經(jīng)驗(yàn)還是拍腦袋進(jìn)行決策,數(shù)據(jù)不是行動(dòng)前必須參考的因素,這是習(xí)慣使然。
不知道數(shù)據(jù)有什么用途。大多數(shù)傳統(tǒng)業(yè)務(wù)尤其是線下企業(yè),不了解數(shù)據(jù)能帶來(lái)哪些價(jià)值;甚至很多時(shí)候?qū)?shù)據(jù)的認(rèn)知缺乏明確的引導(dǎo)和告知,甚至很多時(shí)候數(shù)據(jù)的價(jià)值會(huì)被業(yè)務(wù)方認(rèn)為是證明或驗(yàn)證自身設(shè)想正確與否的途徑。
不相信數(shù)據(jù)。當(dāng)面臨數(shù)據(jù)結(jié)果與業(yè)務(wù)經(jīng)驗(yàn)相沖突時(shí),業(yè)務(wù)方的第一反應(yīng)很可能是懷疑數(shù)據(jù)的正確性,他們更愿意相信自己的經(jīng)驗(yàn)而非數(shù)據(jù)結(jié)論。
數(shù)據(jù)分析師不能要求業(yè)務(wù)方必須懂?dāng)?shù)據(jù)、理解數(shù)據(jù),但是需要告訴業(yè)務(wù)方數(shù)據(jù)能解決什么問(wèn)題、帶來(lái)哪些改進(jìn)與提升,如何幫助他們解決實(shí)際問(wèn)題等數(shù)據(jù)價(jià)值告知業(yè)務(wù),如何能用數(shù)據(jù)證明其提升價(jià)值會(huì)更有說(shuō)服力。這樣業(yè)務(wù)方才會(huì)相信數(shù)據(jù)的有效性、真實(shí)性、準(zhǔn)確性。在業(yè)務(wù)方還沒(méi)有具備數(shù)據(jù)意識(shí)之前,如何培養(yǎng)其數(shù)據(jù)意識(shí)呢?
持續(xù)溝通。每周至少1次、每次至少半個(gè)小時(shí)的專項(xiàng)溝通,一段時(shí)間之后業(yè)務(wù)方會(huì)形成一定的數(shù)據(jù)潛意識(shí),在某些時(shí)候會(huì)想到數(shù)據(jù)可能會(huì)幫助他們解決一些問(wèn)題。
價(jià)值導(dǎo)向。在與業(yè)務(wù)方溝通的過(guò)程中,強(qiáng)調(diào)和關(guān)注的重點(diǎn)不是數(shù)據(jù)本身,而是數(shù)據(jù)能給業(yè)務(wù)方帶來(lái)哪些實(shí)際利益、實(shí)現(xiàn)哪些突破,尤其是幫助業(yè)務(wù)方解決最核心的關(guān)注點(diǎn)。
關(guān)注整體。數(shù)據(jù)不僅能在業(yè)務(wù)動(dòng)作后進(jìn)行效果評(píng)估,還能在業(yè)務(wù)執(zhí)行前進(jìn)行業(yè)務(wù)預(yù)測(cè)與計(jì)劃、在業(yè)務(wù)執(zhí)行過(guò)程中進(jìn)行及時(shí)預(yù)警與數(shù)據(jù)監(jiān)控,數(shù)據(jù)發(fā)揮作用的場(chǎng)景是完整的,防微杜漸比亡羊補(bǔ)牢更有效。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10