
0歲數(shù)據(jù)分析師的入門指南
初入數(shù)據(jù)分析行業(yè)的同學(xué)或還在門口徘徊想要從事數(shù)據(jù)分析職業(yè)的同學(xué)常常會(huì)比較困惑,非常迫切地想要知道作為一個(gè)數(shù)據(jù)分析師,到底需要掌握那些技能,這里筆者作為過(guò)來(lái)人給到大家一點(diǎn)建議。(注意這里適用的是互聯(lián)網(wǎng)行業(yè)的數(shù)據(jù)分析師,不一定適合傳統(tǒng)行業(yè)。)
一、數(shù)據(jù)分析師是做什么的
首先,你需要了解,數(shù)據(jù)分析師到底是干什么的,該職位在企業(yè)中在扮演一個(gè)什么樣的角色,為了能結(jié)合實(shí)際情況進(jìn)行闡述,這里先給大家看一下某公司招聘數(shù)據(jù)分析師的JD,
工作職責(zé)
1、支持各種常規(guī)或臨時(shí)數(shù)據(jù)分析需求;
2、提供各類業(yè)務(wù)相關(guān)的分析及建議;
3、通過(guò)建模深入挖掘用戶或產(chǎn)品方面的有價(jià)值的信息;
4、和各部門溝通協(xié)調(diào)需求并提出各種新的數(shù)據(jù)分析項(xiàng)目或方案;
5、持續(xù)地改進(jìn)數(shù)據(jù)采集、處理、分析、報(bào)告等各個(gè)流程上的工作。
這里有一些關(guān)鍵詞,“支持”、“分析”、“建議”、“有價(jià)值的信息”、“溝通”、“項(xiàng)目”、“方案”,通過(guò)這些關(guān)鍵詞可以一窺數(shù)據(jù)分析師的功能所在。一般來(lái)講數(shù)據(jù)分析師的日常工作主要分為3部分內(nèi)容,
(1)支持各業(yè)務(wù)部門或者領(lǐng)導(dǎo)的日常的數(shù)據(jù)需求。
(2)針對(duì)主題或研究專項(xiàng)進(jìn)行深入的數(shù)據(jù)分析,形成有結(jié)論和建議的分析報(bào)告,甚至是解決方案。
(3)持續(xù)的跟進(jìn)一個(gè)項(xiàng)目,和業(yè)務(wù)人員一樣為該項(xiàng)目的KPI負(fù)責(zé),同時(shí)具有項(xiàng)目推動(dòng)能力和主人翁精神,“不計(jì)一切手段”地想辦法達(dá)到目標(biāo),經(jīng)常需要從數(shù)據(jù)上給項(xiàng)目組成員們提供insights。
這里每一部分的內(nèi)容對(duì)分析師的能力要求有所不同,能做好第一部分的人是一個(gè)合格數(shù)據(jù)分析師助理(或者說(shuō)叫數(shù)據(jù)專員),能做好第二部分的人是一個(gè)不錯(cuò)的初級(jí)數(shù)據(jù)分析師,能做好第三部分的人才是一個(gè)真正優(yōu)秀且對(duì)企業(yè)有極高價(jià)值的數(shù)據(jù)分析師。
在我的職業(yè)生涯中,不止一次的被前輩們教導(dǎo),一個(gè)優(yōu)秀的數(shù)據(jù)分析師,一定不能是一個(gè)“取數(shù)機(jī)器”,他要是有頭腦,有想法,有能力發(fā)現(xiàn)問(wèn)題并且解決問(wèn)題的,當(dāng)然我相信在這個(gè)行業(yè)能做到這一點(diǎn)的人是鳳毛麟角的。如果你已經(jīng)是一枚數(shù)據(jù)分析師了,不妨按照上面的幾點(diǎn)對(duì)號(hào)入座,看看自己已經(jīng)進(jìn)階到哪一步了,又有哪些地方還尚需努力。
二、數(shù)據(jù)分析師的必備技能之工具篇
在身邊偶爾會(huì)聽到別人說(shuō)做數(shù)據(jù)分析師,工具不是很重要,重要的是那些軟實(shí)力,其實(shí)這一點(diǎn)我并不敢茍同。俗話說(shuō)工欲善其事必先利其器,所以工具用的好,其實(shí)是可以極大的提升工作效率的。那么作為一名數(shù)據(jù)分析師,都需要掌握哪些工具呢,這里先列出使用頻率最高的3個(gè)工具。
(1)sql
學(xué)習(xí)寫sql是做數(shù)據(jù)分析師的第一步,對(duì)于沒(méi)有數(shù)據(jù)庫(kù)和編程語(yǔ)言基礎(chǔ)的人來(lái)講,也并不是一件十分困難的事兒,關(guān)鍵在于你是否能找到一個(gè)“好師傅”帶你飛,這里的“好師傅”一是指教你寫sql的入門書籍,上面會(huì)系統(tǒng)的講解sql的相關(guān)知識(shí)并且最好有實(shí)例教學(xué);二是指在工作中會(huì)有前輩教你一些書寫sql的良好習(xí)慣以及優(yōu)化代碼的方法等等(要知道把功能實(shí)現(xiàn)是一碼事兒,高效的把功能實(shí)現(xiàn)是另一碼事兒)。這里附上一本我學(xué)習(xí)sql的書,需要的人自行認(rèn)領(lǐng)——《SQL基礎(chǔ)教程》MICK 著(人民郵電出版社)。優(yōu)化sql的方法如有需要,我會(huì)再開一篇文章給大家分享。
(2)excel
我認(rèn)為第二重要的工具是excel,而非R,SAS, SPSS, 作為數(shù)據(jù)分析師,其實(shí)和建模師不同的是,分析師更多的時(shí)候是在分析數(shù)據(jù),而不是建模,分析數(shù)據(jù)的時(shí)候你總得把數(shù)據(jù)放到一個(gè)文件里邊是吧,這個(gè)文件就是excel。excel的功能遠(yuǎn)比我們想象的要強(qiáng)大許多,我見過(guò)每天用excel做報(bào)表的(還是在大型互聯(lián)網(wǎng)公司),見過(guò)每天寫vba處理上百封數(shù)據(jù)的,見過(guò)用excel畫出十分精美的圖表的,毫不夸張的說(shuō),做為一個(gè)數(shù)據(jù)分析師基本每天都要打開關(guān)閉幾十個(gè)excel。那么,怎么把excel用的好呢?我覺(jué)得有一下幾個(gè)模塊要學(xué)會(huì)
第一個(gè)是公式,excel常用公式要熟練,網(wǎng)上很多教程,很容易找到。
第二個(gè)是數(shù)據(jù)透視表,因?yàn)榉治鰯?shù)據(jù)的時(shí)候經(jīng)常需要拆分到更細(xì)的粒度,所以數(shù)據(jù)透視表不可或缺。
第三個(gè)是圖表,excel的圖表功能基本已經(jīng)可以滿足一個(gè)數(shù)據(jù)分析師的日常需要了,但是什么數(shù)據(jù)畫什么圖,這也是一門學(xué)問(wèn),比如說(shuō)想要表達(dá)趨勢(shì),那最好畫線圖,如果是想表示各個(gè)部分的占比,無(wú)需縱向?qū)Ρ龋亲詈卯嬶瀳D。(這里如有需要我會(huì)再開一篇文章寫圖表的使用方法)。
(3)統(tǒng)計(jì)工具(R or SPSS)
一般情況下數(shù)據(jù)分析師極少會(huì)用到統(tǒng)計(jì)軟件,但是在一些特殊情況下會(huì)有用到。比如有的公司也會(huì)要求數(shù)據(jù)分析師做建模一類的工作(一般這類公司缺少數(shù)據(jù)挖掘的專業(yè)人才),這個(gè)時(shí)候數(shù)據(jù)分析師可能首先需要了解一些經(jīng)典的統(tǒng)計(jì)模型(最最常用的是邏輯回歸模型),為了快速掌握,其實(shí)你大可不必去找一本《機(jī)器學(xué)習(xí)》去死磕書本,而是只要了解這個(gè)模型的使用場(chǎng)景、數(shù)據(jù)處理的方法、使用何種軟件實(shí)現(xiàn)就可以了,這里可能會(huì)要求你有一定的概率統(tǒng)計(jì)基礎(chǔ),但就算是沒(méi)有,你也不必要特別擔(dān)心,搞清楚模型的輸入和輸出,最后證明模型真的是有用的,這才是王道。(更加專業(yè)的數(shù)據(jù)挖掘我也較少涉獵,感興趣的同學(xué)可以自行想辦法學(xué)習(xí))。
如果一個(gè)人會(huì)寫sql,精通excel,可以繪制精美的圖表,并且懂得一些常用的統(tǒng)計(jì)模型,基本上在面試數(shù)據(jù)分析師職位的時(shí)候工具關(guān)就可以過(guò)了。當(dāng)然這里還有一些其他的工具,在工作中也起到很大的幫助,比如畫結(jié)構(gòu)圖的mindmanager,幫助你收藏處理工作文件的有道云筆記,以及做報(bào)告時(shí)常常用到的ppt。
三、數(shù)據(jù)分析師的必備技能之思維篇
上面也提到了,數(shù)據(jù)分析師的主要職責(zé)是發(fā)現(xiàn)問(wèn)題,分析問(wèn)題,解決問(wèn)題,所以數(shù)據(jù)分析師主要是靠腦子吃飯,思路決定出路。一般招聘人會(huì)在JD中描述要求分析師有“數(shù)據(jù)敏感度”以及“嚴(yán)謹(jǐn)?shù)倪壿嬎季S能力”等,但是這些到底是什么?這里就給大家講講我個(gè)人的一些理解。
舉個(gè)例子,小王做數(shù)據(jù)的時(shí)候發(fā)現(xiàn)公司9月份的收入相比去年9月增長(zhǎng)了30%,十分高興的在10月初的月度會(huì)議上跟領(lǐng)導(dǎo)匯報(bào)了這一好消息,領(lǐng)導(dǎo)卻并沒(méi)有開心,因?yàn)楣镜闹饕杖雭?lái)自軟件銷售費(fèi)用,9月份是公司的淡季,軟件銷售量并沒(méi)有增長(zhǎng),而且相比去年的時(shí)候單價(jià)還下降了,收入怎么可能會(huì)有增長(zhǎng)?領(lǐng)導(dǎo)要求小王對(duì)這個(gè)數(shù)據(jù)進(jìn)行核查,后來(lái)經(jīng)過(guò)排查才發(fā)現(xiàn)原來(lái)是財(cái)務(wù)部的人將公司歷史上的“僵尸賬戶”(指的是賬戶里面有錢但是一直沒(méi)有用)統(tǒng)一放到9月份進(jìn)行核銷了,導(dǎo)致收入大漲。
看完這個(gè)例子請(qǐng)你思考一下,什么是數(shù)據(jù)敏感度,數(shù)據(jù)敏感度就是當(dāng)數(shù)據(jù)變化的時(shí)候,你是否能夠快速找到跟這個(gè)數(shù)據(jù)聯(lián)動(dòng)變化的指標(biāo),這個(gè)技能非常重要,一是可以幫助你核實(shí)數(shù)據(jù)的準(zhǔn)確性,二是能幫你快速發(fā)現(xiàn)問(wèn)題。什么是邏輯思維能力,邏輯思維能力就是在面對(duì)一件事情的時(shí)候,你往往要在腦海中打無(wú)數(shù)個(gè)問(wèn)號(hào),比如為什么收入會(huì)上漲,是什么原因造成的,要去搞清楚事件背后的真正的邏輯是什么,層層拆解,層層深入,而不是僅僅停留在表面,不愛(ài)思考的人是不會(huì)有嚴(yán)謹(jǐn)?shù)倪壿嬎季S能力的。
四、數(shù)據(jù)分析師的必備技能之溝通篇
溝通是一項(xiàng)軟技能,也是不分職業(yè)的,溝通能力放之四海皆準(zhǔn)。這里我僅僅針對(duì)數(shù)據(jù)分析師的溝通技能給到大家一些建議。
數(shù)據(jù)分析師常常需要和業(yè)務(wù)方溝通數(shù)據(jù)需求,舉個(gè)例子,小李來(lái)找小王要收入的數(shù)據(jù),小王這個(gè)時(shí)候不是一聲不吭的就打開電腦開始寫sql提數(shù),而是問(wèn)小李,“這個(gè)數(shù)據(jù)是用來(lái)做什么的?”小李回答說(shuō),“這不馬上就要年底了嘛,我們要給銷售部分制定KPI!”這個(gè)時(shí)候小王明白了小李需要數(shù)據(jù)的目的是給銷售團(tuán)隊(duì)制定明年的收入目標(biāo)。小王又問(wèn),“明年的銷售計(jì)劃有了嗎?”小李想了想回答說(shuō),“可能預(yù)計(jì)會(huì)3月份銷售旺季提價(jià)一次,并且維持現(xiàn)有的銷售團(tuán)隊(duì)不做新增”。小王又知道了,可能需要將收入拆分成單價(jià)*銷量,再根據(jù)預(yù)測(cè)的銷量去算出總收入,并且預(yù)測(cè)銷量的時(shí)候需要剔除9月份的異常值。所以你看,如果小王沒(méi)有問(wèn)這2個(gè)問(wèn)題,小李拿著今年的收入數(shù)據(jù)真的能做出一個(gè)合理的目標(biāo)值嗎?
我了解到在一些互聯(lián)網(wǎng)公司,業(yè)務(wù)人員往往并不喜歡主動(dòng)和分析師溝通,他們把分析師當(dāng)做“取數(shù)機(jī)器”,只是單純的認(rèn)為我要這個(gè)數(shù)據(jù),你就給我這個(gè)數(shù)據(jù)就可以了,但是事實(shí)是,有很多人,他們自己的數(shù)據(jù)分析能力有限,對(duì)問(wèn)題的理解能力也有限,往往心里期望拿到A數(shù)據(jù),表達(dá)出來(lái)確是B數(shù)據(jù),所以這個(gè)時(shí)候,數(shù)據(jù)分析師一定要耐心的和業(yè)務(wù)人員多多溝通,一來(lái)可以提高你的工作效率,以免重新返工,二來(lái)就是借此機(jī)會(huì)和業(yè)務(wù)員人員聊聊天,了解業(yè)務(wù),彼此建立信任的關(guān)系。畢竟數(shù)據(jù)分析師是為了業(yè)務(wù)服務(wù)的,離業(yè)務(wù)太遠(yuǎn)的數(shù)據(jù)分析就是空中閣樓,是不接地氣的。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10