
年薪50萬的大數(shù)據(jù)分析師養(yǎng)成記
以下是一位在數(shù)據(jù)分析領域打滾了N年后的分析師寫下的一些總結和體會大家可以借鑒學習!
一、成為數(shù)據(jù)分析師有哪些要求?
1、理論知識要寬泛,涉及數(shù)學、市場和技術。要求及對數(shù)據(jù)敏感,包括統(tǒng)計知識、市場研究、模型原理等。
2、常規(guī)分析工具的使用,包括數(shù)據(jù)庫、數(shù)據(jù)挖掘、統(tǒng)計分析工具,常用辦公軟件(Excel、PPT、思維導圖)等等。
3、有一定的業(yè)務理解能力,能理解業(yè)務背后的商業(yè)邏輯。因為只有理解了商業(yè)問題,才能轉換成數(shù)據(jù)分析的問題,從而滿足部門的要求。
4、數(shù)據(jù)報告和數(shù)據(jù)可視化的能力。數(shù)據(jù)分析得再好,如果不能以漂亮的方式“表達”,成效也會大打折扣。
二、把數(shù)據(jù)分析當做一種能力來培養(yǎng)
現(xiàn)在大多工作都需要你擁有邏輯分析能力,尤其是對數(shù)據(jù)的分析理解。在數(shù)據(jù)化運營理念深入的今天,BAT這樣的大型互聯(lián)網(wǎng)公司強調全員參與數(shù)據(jù)化運營,把數(shù)據(jù)分析當作一種能力在培訓,也必定是未來趨勢。
三、數(shù)據(jù)分析師所需具備的能力和知識(從數(shù)據(jù)分析的4個步驟來理解)
數(shù)據(jù)分析的四個步驟:數(shù)據(jù)獲取、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)呈現(xiàn)。
1、數(shù)據(jù)獲取
數(shù)據(jù)獲取看似簡單,但是需要把握對問題的商業(yè)理解,轉化成數(shù)據(jù)問題來解決,直白點講就是需要哪些數(shù)據(jù),從哪些角度來分析,界定問題后,再進行數(shù)據(jù)采集。此環(huán)節(jié),需要數(shù)據(jù)分析師具備結構化的邏輯思維。
推薦書籍:《金字塔原理》、麥肯錫三部曲:麥肯錫意識、工具、方法;
推薦工具:思維導圖工具(Xmind\百度腦圖等);
2、數(shù)據(jù)處理
數(shù)據(jù)的處理需要掌握有效率的工具:
Excel及高端技能:日常工作通用,容易掌握,處理10萬級別的數(shù)據(jù)很輕松。
學習高端Excel需要哪些技能?
學習excel是個循序漸進的過程
基礎:簡單的表格數(shù)據(jù)處理、打印、查詢、篩選、排序
函數(shù)和公式:常用函數(shù)、高級數(shù)據(jù)計算、數(shù)組公式、多維引用、function
可視化圖表:圖形圖示展示、高級圖表、圖表插件
數(shù)據(jù)透視表、VBA程序開發(fā)
按照我習慣的方法,先過一遍基礎,知道什么是什么,然后找?guī)讉€case練習。多逛逛excelhome論壇,平常多思考如何用excel來解決問題,善用插件,還有記得保存。
Oracle和SQL sever:企業(yè)最常用的千萬級別的數(shù)據(jù)庫,熟練掌握SQL語言。
保持不斷的技術學習,比如學習新流行的hadoop之類的分布式數(shù)據(jù)庫來提升個人能力,對求職有幫助。
3、分析數(shù)據(jù)
分析數(shù)據(jù)往往需要各類統(tǒng)計分析模型,如關聯(lián)規(guī)則、聚類、分類、預測模型等等。
因此,熟練掌握一些統(tǒng)計分析工具不可免:
SPSS系列:老牌的統(tǒng)計分析軟件,SPSS Statistics(偏統(tǒng)計功能、市場研究)、SPSS Modeler(偏數(shù)據(jù)挖掘),不用編程,易學。
SAS:經(jīng)典挖掘軟件,需要編程。
R:開源軟件,新流行,對非結構化數(shù)據(jù)處理效率上更高,需編程。
各類BI工具:
Tableau:可視化工具的鼻祖,對于處理好的數(shù)據(jù)可作自由的可視化分析,圖表效果驚人
大數(shù)據(jù)BI工具FineBI:類同Tableau,可在前端做任意維度分析;數(shù)據(jù)可在前端繼續(xù)處理(計算、篩選過濾等),可對接hadoop之類的大數(shù)據(jù)平臺,數(shù)據(jù)處理性能較好。
推薦書籍:
1、《說菜鳥不會數(shù)據(jù)分析》系列,入門級書,初學者最適。
2、《數(shù)據(jù)挖掘與數(shù)據(jù)化運營實戰(zhàn),思路、方法、技巧與應用》,內容很系統(tǒng)很全面。
3、《市場研究定量分析方法與應用》,簡明等編著,中國人民大學出版社。
4、數(shù)據(jù)可視化呈現(xiàn)
很多數(shù)據(jù)分析工具已經(jīng)涵蓋了數(shù)據(jù)可視化部分,只需要把數(shù)據(jù)結果進行有效的呈現(xiàn)和演講匯報,可用word\PPT\H5等方式展現(xiàn)。
四、關于數(shù)據(jù)分析師的職業(yè)發(fā)展
1、數(shù)據(jù)分析師通常分兩類,技術型分析師和業(yè)務型分析師,分工不同,但各有優(yōu)勢。
技術型分析師是在專門的挖掘團隊里面從事數(shù)據(jù)挖掘和分析工作的。如果你能在這類專業(yè)團隊學習成長,那是幸運的,但進入這類團隊的門檻較高,需要扎實的數(shù)據(jù)挖掘知識、挖掘工具應用經(jīng)驗和編程能力。該類分析師更偏向技術線條,未來的職業(yè)通道可能走專家的技術路線。技術型分析師的角色包括數(shù)據(jù)工程師、挖掘工程師、數(shù)據(jù)科學家、建模工程師、數(shù)據(jù)架構師、ETL工程師等,這些稱謂都或多或少代表了其工作性質。
業(yè)務型分析師是下沉到各業(yè)務團隊或者運營部門的數(shù)據(jù)分析師,成為業(yè)務團隊的一員。他們工作是支撐業(yè)務運營,包括日常業(yè)務的異常監(jiān)控、客戶和市場研究、參與產(chǎn)品開發(fā)、建立數(shù)據(jù)模型提升運營效率等。該類型分析師偏向產(chǎn)品和運營,可以轉向做運營和產(chǎn)品。
2、數(shù)據(jù)分析師的理想行業(yè)在互聯(lián)網(wǎng),但條條大道通羅馬,走合適你的路線。
從行業(yè)的角度來看:
1)互聯(lián)網(wǎng)行業(yè)是數(shù)據(jù)分析應用最廣的行業(yè),其中的電商企業(yè),更是目前最火的,而且企業(yè)也更重視數(shù)據(jù)分析的價值,是數(shù)據(jù)分析師理想的成長平臺。
2)其次是咨詢公司(比如專門的數(shù)據(jù)挖掘公司Teradata、尼爾森等市場研究公司),他們需要數(shù)據(jù)分析人才,而且相對來說,數(shù)據(jù)分析師在咨詢公司成長的速度更快,專業(yè)也會更全面。
3)再次是金融行業(yè),比如銀行和證券等行業(yè),該行業(yè)對數(shù)據(jù)分析的依賴需求,越來越大。
4)最后是電信行業(yè)(中國移動、聯(lián)通和電信),它們擁有海量的數(shù)據(jù),在嚴峻的競爭下,也越來越重視數(shù)據(jù)分析,但進入這些公司的門檻比較高。
五、什么人適合學習數(shù)據(jù)分析?
這個問題之前有詳細寫過一篇文章哪些人能做好數(shù)據(jù)分析?就好比學功夫一樣,既要有天賦也要有后天的努力,但我想后者占大部分,鐵杵也能磨成針。
六、如何系統(tǒng)地學習數(shù)據(jù)分析?
學習方法千萬種,關鍵是找到適合自己的,最好能夠結合你的工作遇到的問題來學習。
這里我列舉一個經(jīng)典的從0到1的入門方法
第一周:Excel學習掌握
第二周:數(shù)據(jù)可視化
第三周:分析思維的訓練
第四周:數(shù)據(jù)庫學習
第五周:統(tǒng)計知識學習
第六周:業(yè)務學習
第七周:Python/R學習
七、最后
請再次問問自己,是否真的喜歡數(shù)據(jù)分析,能否忍受處理數(shù)據(jù)時的寂寞?如果是,那就宜早不宜遲,馬上開始行動吧。
再次強調:
1、把數(shù)據(jù)分析作為一種能力培養(yǎng),讓自己在現(xiàn)在的團隊中展現(xiàn)出良好的數(shù)據(jù)分析能力,為你以后內部轉崗做好準備。如果內部轉崗不成,你可以考慮跳槽到我之前分析的行業(yè)中,但我強烈建議你還是需要把系統(tǒng)開發(fā)的編程能力學習好,并且對商業(yè)智能系統(tǒng)(BI和CRM)有一定了解,這也許是應聘數(shù)據(jù)分析的優(yōu)勢。如果沒有數(shù)據(jù)分析經(jīng)驗去應聘,相對會難一些,用人單位會考你統(tǒng)計和數(shù)據(jù)挖掘模型方面的知識,以及工具使用情況。
2、扎實學好一、兩門數(shù)據(jù)挖掘軟件,基于你已有得編程基礎,可以學SAS或者R,基本能夠滿足很大部分企業(yè)的需求。
3、多看多想多觀察,學習業(yè)務職能是這樣,細水長流,還需要不斷工作積累和廣泛的閱讀。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10