
如果你也想當(dāng)數(shù)據(jù)分析師
時(shí)下最熱的莫過于大數(shù)據(jù),這三個(gè)從誕生起,就有太多的光環(huán)套在腦袋上。隨之而來的就是數(shù)據(jù)挖掘師,數(shù)據(jù)分析師,數(shù)據(jù)科學(xué)家……
如果你也想當(dāng)數(shù)據(jù)分析師,那么你也許該看看下面的內(nèi)容:
1.數(shù)據(jù)是有立場(chǎng)的,立場(chǎng)決定解讀
數(shù)據(jù)對(duì)于業(yè)務(wù)來講,是KPI的衡量標(biāo)桿,也是行動(dòng)指南。但一旦涉及到立場(chǎng)和方向性的東西,必然有利益觸發(fā)點(diǎn)的問題。比如同樣的一次活動(dòng)的網(wǎng)站轉(zhuǎn)化率是1.2%,是好還是壞?這是做數(shù)據(jù)分析的第一步,要進(jìn)行的定位,也就是我們所說的下結(jié)論。
好壞的區(qū)分在于比較,如何比較呢?我們知道比較分析方法有環(huán)比、占比、定基比、橫向比、縱向比等,其中如環(huán)比可以比較昨日、上周今日、上月今日等,不同的時(shí)間對(duì)比出的結(jié)果一定有差異,甚至是迥然不同的結(jié)果。
那面對(duì)這種情況,除了分析師的經(jīng)驗(yàn)以外,在都符合統(tǒng)計(jì)學(xué)規(guī)律的前提下該如何判斷活動(dòng)效果好壞?
第一步結(jié)果總算出來了。
那么,假設(shè)結(jié)果是好的(先不管對(duì)比的是什么時(shí)間),確實(shí)是好的嗎?我們知道做活動(dòng)效果肯定會(huì)好啊。尤其在中國,只要價(jià)格低,無論多么差的用戶體驗(yàn),無論網(wǎng)站UI多么垃圾,無論送貨多么慢,訂單轉(zhuǎn)化率一定會(huì)起來。這就意味著,無論你的營銷、運(yùn)營做的怎么樣(只要不是特別特別差),各個(gè)渠道、各個(gè)節(jié)點(diǎn)轉(zhuǎn)化率都會(huì)上來。這時(shí)候,你會(huì)怎樣分析?其中有多少是歸于渠道或運(yùn)營本身的優(yōu)化因素,而有多少是歸于活動(dòng)影響?
假設(shè)我們能找出其中歸于活動(dòng)本身或渠道、運(yùn)營本身的影響因素,結(jié)果出來后可能是:刨去活動(dòng)影響,渠道、運(yùn)營做的轉(zhuǎn)化率其實(shí)變化不大(事實(shí)上通常是這樣的,但是我們不能否認(rèn)他們的功勞,畢竟沒有流量、沒有運(yùn)營,網(wǎng)站無法正常運(yùn)行),工作效果不明顯?。磕銜?huì)怎樣?直接告訴你的同事,他們的工作沒效果?可能你不會(huì)那樣做,那此時(shí)你該如何取舍?盡職盡責(zé)做好一個(gè)數(shù)據(jù)的本職工作還是考慮下其他因素?怎么做才能既讓數(shù)據(jù)價(jià)值最大化又能不打擊同事的工作積極性?
2.數(shù)據(jù)質(zhì)量永遠(yuǎn)是數(shù)據(jù)分析立項(xiàng)后首先要考慮的
做過大型數(shù)據(jù)分析的同學(xué)剛開始或多或少有這樣的經(jīng)歷,拿到數(shù)據(jù)后經(jīng)過分析發(fā)現(xiàn)了一個(gè)異常分析點(diǎn),做了N多預(yù)處理、N多牛叉的模型,N多分析和多維鉆取,最后把報(bào)告呈現(xiàn)出來,跟業(yè)務(wù)溝通的時(shí)候,業(yè)務(wù)只說了一句話“哦,那個(gè)異常數(shù)據(jù)啊,那是我們的測(cè)試數(shù)據(jù)”,然后我們會(huì)不會(huì)瘋掉?
為什么會(huì)出現(xiàn)這種問題,因?yàn)槟玫綌?shù)據(jù)后沒有進(jìn)行一步必要的步驟——數(shù)據(jù)質(zhì)量驗(yàn)證。什么是數(shù)據(jù)質(zhì)量驗(yàn)證?我理解的是首先要理解數(shù)據(jù)來源、數(shù)據(jù)統(tǒng)計(jì)和收集邏輯、數(shù)據(jù)入庫處理邏輯;其次是理解數(shù)據(jù)在數(shù)據(jù)倉庫中是如何存放的,字段類型、小數(shù)點(diǎn)位數(shù)、取值范圍,規(guī)則約束如何定義的;第三是明確數(shù)據(jù)的取數(shù)邏輯,尤其是從數(shù)據(jù)倉庫中如何用SQL取數(shù)的,其中特別是對(duì)數(shù)據(jù)有沒有經(jīng)過轉(zhuǎn)換和重新定義;第四是拿到數(shù)據(jù)后必須要有數(shù)據(jù)審查的過程,包括數(shù)據(jù)有效性驗(yàn)證、取值范圍、空值和異常值處理等。
當(dāng)這些工作都做充足之后才是數(shù)據(jù)分析。但可惜的是大多數(shù)數(shù)據(jù)分析師都不關(guān)注數(shù)據(jù)質(zhì)量問題,甚至對(duì)數(shù)據(jù)的理解僅限于表現(xiàn)定義。當(dāng)然做足了底層的工作,你會(huì)發(fā)現(xiàn)做起數(shù)據(jù)來事半功倍,并且你的結(jié)論和推到是經(jīng)得起驗(yàn)證和考究的。
3.缺乏落地的數(shù)據(jù)沒價(jià)值,除非是市場(chǎng)分析
數(shù)據(jù)的價(jià)格在于對(duì)業(yè)務(wù)的驅(qū)動(dòng),不管你的業(yè)務(wù)對(duì)象是你的BOSS還是同事。
很多情況下,我們的數(shù)據(jù)分析師是這樣工作的:一天到晚悶頭做事,出數(shù)據(jù)寫報(bào)告。結(jié)果出來的數(shù)據(jù)結(jié)論和建議會(huì)有這么幾種情況:分析過程明顯不符合業(yè)務(wù)操作實(shí)際;結(jié)論明顯是錯(cuò)的;建議方向性很對(duì),但是空洞,具體執(zhí)行缺乏落地點(diǎn);建議方向性很明確,也有具體執(zhí)行建議,但是業(yè)務(wù)不能執(zhí)行;上面的問題中,第一二條會(huì)偶爾發(fā)生,第三四條會(huì)經(jīng)常發(fā)生。為什么?從數(shù)據(jù)的角度來講沒問題,但是落實(shí)到業(yè)務(wù)實(shí)際上有問題。問題出現(xiàn)哪?主要是這幾方面:
① 數(shù)據(jù)分析師根本不懂業(yè)務(wù)操作流程,憑自己的理解去猜測(cè)業(yè)務(wù)流程;
② 數(shù)據(jù)分析師根本不知道現(xiàn)在業(yè)務(wù)的困難點(diǎn)在哪里,哪些是目前最緊急的,憑自己的感覺,認(rèn)為“我覺得這些對(duì)他們最最有用”;
③ 數(shù)據(jù)分析師根本不知道業(yè)務(wù)能控制哪些,不能控制哪些,即使能控制又是否業(yè)務(wù)有必要去做,導(dǎo)致建議不是該業(yè)務(wù)部門能執(zhí)行的。
4.數(shù)據(jù)解讀能力和業(yè)務(wù)應(yīng)用能力永遠(yuǎn)大于工具應(yīng)用能力,不要迷信算法和模型
受至于數(shù)據(jù)的普遍理論影響,很多數(shù)據(jù)分析師會(huì)認(rèn)為會(huì)多少個(gè)模型,多少種算法是一件多么牛叉的事情,誠然,數(shù)據(jù)尤其在面對(duì)海量數(shù)據(jù)時(shí),普通的數(shù)據(jù)分析方法常常感覺無能為力,但這并不意味著工具和方法就決定了數(shù)據(jù)分析師的層次。
舉例來說,通常我們用的數(shù)據(jù)挖掘模型,業(yè)務(wù)都很難理解,假如你花了很長時(shí)間作出一個(gè)關(guān)聯(lián)模型,如果你這樣告訴你的業(yè)務(wù)受眾:A商品和B商品關(guān)聯(lián)程度較高,從支持度,置信度和提升度來講效果顯著。那我們可以預(yù)想到這個(gè)挖掘的結(jié)果很難落地,并且意義不大。
從業(yè)務(wù)受眾實(shí)際應(yīng)用層面來講,兩個(gè)商品的關(guān)聯(lián)度高意味著什么,意味著用戶通常會(huì)一起購買這兩件商品(也有可能是復(fù)購,具體看數(shù)據(jù)選取規(guī)則),那一起購買又怎樣?我們是否可以把這兩件商品做打包促銷?是否可以做關(guān)聯(lián)推薦?是否可以做個(gè)性化營銷?是否可以引導(dǎo)用戶消費(fèi)的傾向?甚至在活動(dòng)頁面設(shè)計(jì)上,是否可以將相關(guān)度高的品類,品牌擺放在一起來促進(jìn)銷售?又或者這是否可以做流失挽回的參照指標(biāo),重新審視之前每次的廣告“通發(fā)”?這才是數(shù)據(jù)價(jià)值,無法跟業(yè)務(wù)結(jié)合的數(shù)據(jù)模型毫無價(jià)值。
5.業(yè)務(wù)需求是數(shù)據(jù)分析的起點(diǎn),但之前你需要培養(yǎng)業(yè)務(wù)的數(shù)據(jù)意識(shí)
很多時(shí)候我們希望等待我們的業(yè)務(wù)自己上門提需求,并且以需求為數(shù)據(jù)分析的起點(diǎn),似乎很多教材也是這么說的,基于業(yè)務(wù)需求的數(shù)據(jù)分析目的更明確,分析結(jié)論和效果落地也會(huì)阻力更小,但實(shí)際情況是業(yè)務(wù)通常是數(shù)據(jù)不敏感的,主要表現(xiàn)在:
業(yè)務(wù)沒有數(shù)據(jù)決策的意識(shí)。
大多數(shù)業(yè)務(wù)的第一行動(dòng)引導(dǎo)因素還是業(yè)務(wù)經(jīng)驗(yàn),無論是基于事實(shí)的經(jīng)驗(yàn)還是拍腦袋決策,數(shù)據(jù)絕對(duì)不是行動(dòng)前必須參考的因素;業(yè)務(wù)不知道數(shù)據(jù)在哪些方面能幫到他。
業(yè)務(wù)很多時(shí)候只是有個(gè)想法,想讓數(shù)據(jù)證明點(diǎn)什么,但說不清楚。通常業(yè)務(wù)的措辭是“我們想知道這次活動(dòng)的效果怎么樣”、“我們想了解廣告效果為什么不好”。至于具體效果指的是什么業(yè)務(wù)自己也說不清楚,甚至是業(yè)務(wù)自己也不知道到底想要什么。業(yè)務(wù)不相信數(shù)據(jù)。
如果數(shù)據(jù)結(jié)果出來時(shí)和業(yè)務(wù)設(shè)想的不同,那業(yè)務(wù)的第一反應(yīng)是懷疑數(shù)據(jù),無論是數(shù)據(jù)的出處、分析過程還是結(jié)論,業(yè)務(wù)總想找到能證明自己觀點(diǎn)對(duì)的東西。所以我們會(huì)感覺,業(yè)務(wù)用數(shù)據(jù)的目的只是為了證明自己當(dāng)初設(shè)想的正確性。
作為數(shù)據(jù)分析師,我們不能要求業(yè)務(wù)必須要懂?dāng)?shù)據(jù)、理解數(shù)據(jù),但是我們需要把數(shù)據(jù)能解決什么問題,怎么解決的,解決之后會(huì)給業(yè)務(wù)帶來哪些改進(jìn)以及效果上的優(yōu)化,如果能預(yù)測(cè)出一個(gè)具體數(shù)值或最起碼有一個(gè)范圍,業(yè)務(wù)會(huì)更加相信數(shù)據(jù)的真實(shí)性、準(zhǔn)確性。如果培養(yǎng)業(yè)務(wù)的數(shù)據(jù)意識(shí)?
數(shù)據(jù)意識(shí)是一個(gè)不斷積累的過程,需要每周至少 2~3次專項(xiàng)溝通,每次溝通至少持續(xù)半個(gè)小時(shí),大概半年之后業(yè)務(wù)會(huì)形成一定的數(shù)據(jù)意識(shí),最起碼意識(shí)到在某些時(shí)候,數(shù)據(jù)會(huì)解決一些問題;每次溝通時(shí),明確告訴業(yè)務(wù)數(shù)據(jù)能給他們帶來哪些好處,能實(shí)現(xiàn)什么,在哪些主要業(yè)務(wù)點(diǎn)上能發(fā)揮作用,這樣業(yè)務(wù)會(huì)認(rèn)為數(shù)據(jù)會(huì)是一個(gè)能幫到自己的東西;數(shù)據(jù)不只是在業(yè)務(wù)執(zhí)行之后才會(huì)發(fā)生作用的,在業(yè)務(wù)執(zhí)行前的預(yù)測(cè)與計(jì)劃,在業(yè)務(wù)執(zhí)行過程中及時(shí)預(yù)警與惡意數(shù)據(jù)監(jiān)控都是數(shù)據(jù)能發(fā)揮作用的場(chǎng)合,并且這些都能在“壞數(shù)據(jù)”、“壞結(jié)果”出來之前通過數(shù)據(jù)區(qū)去改善,這些將比結(jié)果出來后再去分析要更有意義。
作為數(shù)據(jù)分析師,需要不斷提高自身能力。能力包括業(yè)務(wù)理解能力和數(shù)據(jù)分析能力,既能把業(yè)務(wù)“粗糙的要求”轉(zhuǎn)換成數(shù)據(jù)需求,又能將數(shù)據(jù)結(jié)果轉(zhuǎn)化成業(yè)務(wù)可理解、可執(zhí)行、有時(shí)間限制、能驗(yàn)證結(jié)果的數(shù)據(jù)輸出。
數(shù)據(jù)是一門藝術(shù),良好的數(shù)據(jù)能力可以處處在業(yè)務(wù)中展現(xiàn)能力,并且確實(shí)可以提高業(yè)務(wù)價(jià)值,這是數(shù)據(jù)存在根本,也是數(shù)據(jù)分析師立足的根本。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03