
0歲數(shù)據(jù)分析師的入門指南
初入數(shù)據(jù)分析行業(yè)的同學(xué)或還在門口徘徊想要從事數(shù)據(jù)分析職業(yè)的同學(xué)常常會比較困惑,非常迫切地想要知道作為一個數(shù)據(jù)分析師,到底需要掌握那些技能,這里筆者作為過來人給到大家一點建議。(注意這里適用的是互聯(lián)網(wǎng)行業(yè)的數(shù)據(jù)分析師,不一定適合傳統(tǒng)行業(yè)。)
一、數(shù)據(jù)分析師是做什么的
首先,你需要了解,數(shù)據(jù)分析師到底是干什么的,該職位在企業(yè)中在扮演一個什么樣的角色,為了能結(jié)合實際情況進(jìn)行闡述,這里先給大家看一下某公司招聘數(shù)據(jù)分析師的JD,
工作職責(zé)
1、支持各種常規(guī)或臨時數(shù)據(jù)分析需求;
2、提供各類業(yè)務(wù)相關(guān)的分析及建議;
3、通過建模深入挖掘用戶或產(chǎn)品方面的有價值的信息;
4、和各部門溝通協(xié)調(diào)需求并提出各種新的數(shù)據(jù)分析項目或方案;
5、持續(xù)地改進(jìn)數(shù)據(jù)采集、處理、分析、報告等各個流程上的工作。
這里有一些關(guān)鍵詞,“支持”、“分析”、“建議”、“有價值的信息”、“溝通”、“項目”、“方案”,通過這些關(guān)鍵詞可以一窺數(shù)據(jù)分析師的功能所在。一般來講數(shù)據(jù)分析師的日常工作主要分為3部分內(nèi)容,
(1)支持各業(yè)務(wù)部門或者領(lǐng)導(dǎo)的日常的數(shù)據(jù)需求。
(2)針對主題或研究專項進(jìn)行深入的數(shù)據(jù)分析,形成有結(jié)論和建議的分析報告,甚至是解決方案。
(3)持續(xù)的跟進(jìn)一個項目,和業(yè)務(wù)人員一樣為該項目的KPI負(fù)責(zé),同時具有項目推動能力和主人翁精神,“不計一切手段”地想辦法達(dá)到目標(biāo),經(jīng)常需要從數(shù)據(jù)上給項目組成員們提供insights。
這里每一部分的內(nèi)容對分析師的能力要求有所不同,能做好第一部分的人是一個合格數(shù)據(jù)分析師助理(或者說叫數(shù)據(jù)專員),能做好第二部分的人是一個不錯的初級數(shù)據(jù)分析師,能做好第三部分的人才是一個真正優(yōu)秀且對企業(yè)有極高價值的數(shù)據(jù)分析師。
在我的職業(yè)生涯中,不止一次的被前輩們教導(dǎo),一個優(yōu)秀的數(shù)據(jù)分析師,一定不能是一個“取數(shù)機(jī)器”,他要是有頭腦,有想法,有能力發(fā)現(xiàn)問題并且解決問題的,當(dāng)然我相信在這個行業(yè)能做到這一點的人是鳳毛麟角的。如果你已經(jīng)是一枚數(shù)據(jù)分析師了,不妨按照上面的幾點對號入座,看看自己已經(jīng)進(jìn)階到哪一步了,又有哪些地方還尚需努力。
二、數(shù)據(jù)分析師的必備技能之工具篇
在身邊偶爾會聽到別人說做數(shù)據(jù)分析師,工具不是很重要,重要的是那些軟實力,其實這一點我并不敢茍同。俗話說工欲善其事必先利其器,所以工具用的好,其實是可以極大的提升工作效率的。那么作為一名數(shù)據(jù)分析師,都需要掌握哪些工具呢,這里先列出使用頻率最高的3個工具。
(1)sql
學(xué)習(xí)寫sql是做數(shù)據(jù)分析師的第一步,對于沒有數(shù)據(jù)庫和編程語言基礎(chǔ)的人來講,也并不是一件十分困難的事兒,關(guān)鍵在于你是否能找到一個“好師傅”帶你飛,這里的“好師傅”一是指教你寫sql的入門書籍,上面會系統(tǒng)的講解sql的相關(guān)知識并且最好有實例教學(xué);二是指在工作中會有前輩教你一些書寫sql的良好習(xí)慣以及優(yōu)化代碼的方法等等(要知道把功能實現(xiàn)是一碼事兒,高效的把功能實現(xiàn)是另一碼事兒)。這里附上一本我學(xué)習(xí)sql的書,需要的人自行認(rèn)領(lǐng)——《SQL基礎(chǔ)教程》MICK 著(人民郵電出版社)。優(yōu)化sql的方法如有需要,我會再開一篇文章給大家分享。
(2)excel
我認(rèn)為第二重要的工具是excel,而非R,SAS, SPSS, 作為數(shù)據(jù)分析師,其實和建模師不同的是,分析師更多的時候是在分析數(shù)據(jù),而不是建模,分析數(shù)據(jù)的時候你總得把數(shù)據(jù)放到一個文件里邊是吧,這個文件就是excel。excel的功能遠(yuǎn)比我們想象的要強(qiáng)大許多,我見過每天用excel做報表的(還是在大型互聯(lián)網(wǎng)公司),見過每天寫vba處理上百封數(shù)據(jù)的,見過用excel畫出十分精美的圖表的,毫不夸張的說,做為一個數(shù)據(jù)分析師基本每天都要打開關(guān)閉幾十個excel。那么,怎么把excel用的好呢?我覺得有一下幾個模塊要學(xué)會
第一個是公式,excel常用公式要熟練,網(wǎng)上很多教程,很容易找到。
第二個是數(shù)據(jù)透視表,因為分析數(shù)據(jù)的時候經(jīng)常需要拆分到更細(xì)的粒度,所以數(shù)據(jù)透視表不可或缺。
第三個是圖表,excel的圖表功能基本已經(jīng)可以滿足一個數(shù)據(jù)分析師的日常需要了,但是什么數(shù)據(jù)畫什么圖,這也是一門學(xué)問,比如說想要表達(dá)趨勢,那最好畫線圖,如果是想表示各個部分的占比,無需縱向?qū)Ρ龋亲詈卯嬶瀳D。(這里如有需要我會再開一篇文章寫圖表的使用方法)。
(3)統(tǒng)計工具(R or SPSS)
一般情況下數(shù)據(jù)分析師極少會用到統(tǒng)計軟件,但是在一些特殊情況下會有用到。比如有的公司也會要求數(shù)據(jù)分析師做建模一類的工作(一般這類公司缺少數(shù)據(jù)挖掘的專業(yè)人才),這個時候數(shù)據(jù)分析師可能首先需要了解一些經(jīng)典的統(tǒng)計模型(最最常用的是邏輯回歸模型),為了快速掌握,其實你大可不必去找一本《機(jī)器學(xué)習(xí)》去死磕書本,而是只要了解這個模型的使用場景、數(shù)據(jù)處理的方法、使用何種軟件實現(xiàn)就可以了,這里可能會要求你有一定的概率統(tǒng)計基礎(chǔ),但就算是沒有,你也不必要特別擔(dān)心,搞清楚模型的輸入和輸出,最后證明模型真的是有用的,這才是王道。(更加專業(yè)的數(shù)據(jù)挖掘我也較少涉獵,感興趣的同學(xué)可以自行想辦法學(xué)習(xí))。
如果一個人會寫sql,精通excel,可以繪制精美的圖表,并且懂得一些常用的統(tǒng)計模型,基本上在面試數(shù)據(jù)分析師職位的時候工具關(guān)就可以過了。當(dāng)然這里還有一些其他的工具,在工作中也起到很大的幫助,比如畫結(jié)構(gòu)圖的mindmanager,幫助你收藏處理工作文件的有道云筆記,以及做報告時常常用到的ppt。
三、數(shù)據(jù)分析師的必備技能之思維篇
上面也提到了,數(shù)據(jù)分析師的主要職責(zé)是發(fā)現(xiàn)問題,分析問題,解決問題,所以數(shù)據(jù)分析師主要是靠腦子吃飯,思路決定出路。一般招聘人會在JD中描述要求分析師有“數(shù)據(jù)敏感度”以及“嚴(yán)謹(jǐn)?shù)倪壿嬎季S能力”等,但是這些到底是什么?這里就給大家講講我個人的一些理解。
舉個例子,小王做數(shù)據(jù)的時候發(fā)現(xiàn)公司9月份的收入相比去年9月增長了30%,十分高興的在10月初的月度會議上跟領(lǐng)導(dǎo)匯報了這一好消息,領(lǐng)導(dǎo)卻并沒有開心,因為公司的主要收入來自軟件銷售費用,9月份是公司的淡季,軟件銷售量并沒有增長,而且相比去年的時候單價還下降了,收入怎么可能會有增長?領(lǐng)導(dǎo)要求小王對這個數(shù)據(jù)進(jìn)行核查,后來經(jīng)過排查才發(fā)現(xiàn)原來是財務(wù)部的人將公司歷史上的“僵尸賬戶”(指的是賬戶里面有錢但是一直沒有用)統(tǒng)一放到9月份進(jìn)行核銷了,導(dǎo)致收入大漲。
看完這個例子請你思考一下,什么是數(shù)據(jù)敏感度,數(shù)據(jù)敏感度就是當(dāng)數(shù)據(jù)變化的時候,你是否能夠快速找到跟這個數(shù)據(jù)聯(lián)動變化的指標(biāo),這個技能非常重要,一是可以幫助你核實數(shù)據(jù)的準(zhǔn)確性,二是能幫你快速發(fā)現(xiàn)問題。什么是邏輯思維能力,邏輯思維能力就是在面對一件事情的時候,你往往要在腦海中打無數(shù)個問號,比如為什么收入會上漲,是什么原因造成的,要去搞清楚事件背后的真正的邏輯是什么,層層拆解,層層深入,而不是僅僅停留在表面,不愛思考的人是不會有嚴(yán)謹(jǐn)?shù)倪壿嬎季S能力的。
四、數(shù)據(jù)分析師的必備技能之溝通篇
溝通是一項軟技能,也是不分職業(yè)的,溝通能力放之四海皆準(zhǔn)。這里我僅僅針對數(shù)據(jù)分析師的溝通技能給到大家一些建議。
數(shù)據(jù)分析師常常需要和業(yè)務(wù)方溝通數(shù)據(jù)需求,舉個例子,小李來找小王要收入的數(shù)據(jù),小王這個時候不是一聲不吭的就打開電腦開始寫sql提數(shù),而是問小李,“這個數(shù)據(jù)是用來做什么的?”小李回答說,“這不馬上就要年底了嘛,我們要給銷售部分制定KPI!”這個時候小王明白了小李需要數(shù)據(jù)的目的是給銷售團(tuán)隊制定明年的收入目標(biāo)。小王又問,“明年的銷售計劃有了嗎?”小李想了想回答說,“可能預(yù)計會3月份銷售旺季提價一次,并且維持現(xiàn)有的銷售團(tuán)隊不做新增”。小王又知道了,可能需要將收入拆分成單價*銷量,再根據(jù)預(yù)測的銷量去算出總收入,并且預(yù)測銷量的時候需要剔除9月份的異常值。所以你看,如果小王沒有問這2個問題,小李拿著今年的收入數(shù)據(jù)真的能做出一個合理的目標(biāo)值嗎?
我了解到在一些互聯(lián)網(wǎng)公司,業(yè)務(wù)人員往往并不喜歡主動和分析師溝通,他們把分析師當(dāng)做“取數(shù)機(jī)器”,只是單純的認(rèn)為我要這個數(shù)據(jù),你就給我這個數(shù)據(jù)就可以了,但是事實是,有很多人,他們自己的數(shù)據(jù)分析能力有限,對問題的理解能力也有限,往往心里期望拿到A數(shù)據(jù),表達(dá)出來確是B數(shù)據(jù),所以這個時候,數(shù)據(jù)分析師一定要耐心的和業(yè)務(wù)人員多多溝通,一來可以提高你的工作效率,以免重新返工,二來就是借此機(jī)會和業(yè)務(wù)員人員聊聊天,了解業(yè)務(wù),彼此建立信任的關(guān)系。畢竟數(shù)據(jù)分析師是為了業(yè)務(wù)服務(wù)的,離業(yè)務(wù)太遠(yuǎn)的數(shù)據(jù)分析就是空中閣樓,是不接地氣的。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03