
數據分析師的核心技能是什么
1,市場和環(huán)境
問:1)現在一線城市和二線城市的數據分析師真有像報告上所說的那么稀缺嗎?現在的行情是怎樣的呢?
2)數據分析師日常的工作是什么?分為哪幾類?傳統公司和互聯網的數據分析師工作有什么不同點嗎?
答:1)目前數據分析師這個JOB 確實有缺口,為什么呢?這個由數據分析師本身工作特性決定:
?數據分析師,數據+分析+師,這個意味著從業(yè)者需要懂數據,也要會分析,到了師的境界,說明有一定的經驗積累。一般的大學應屆畢業(yè)生,大學里面沒有類似的專業(yè),懂計算機的不懂數據,懂數據的計算機技能差點,懂數據和計算機的邏輯性不好,最大的一個問題是,很多同學對于定義問題,分析問題,思考問題等基本的能力,都不具備,更別問具體的市場,或者業(yè)務的分析和經驗,所以,應屆畢業(yè)生中統計學專業(yè)的相對靠近數據分析師的基本技能,但是,也僅僅是技能上的靠近。如果畢業(yè)以后不從事這個行業(yè),以后想轉行做這個行業(yè),就相對困難一點,畢竟,隔行如隔山。另外,上面也側面提到了,數據分析師需要具備很多技能,這個比JAVA開發(fā)工程師這樣相對單一技能來說,要復雜一點,所以,這個也是數據分析師缺的一個原因。
?另外,大數據火熱的時間比較短,頂多3-5年左右。應屆畢業(yè)生供求少,相應的從業(yè)人才比較少,又加上最近言必稱數據,公司更是想盡辦法跟大數據沾邊,對于數據人才需求量大。尤其是互聯網公司的發(fā)展太快,互聯網公司對于數據人才的需求更大。儲備少 VS 需求大,自然就有缺口了。
?目前數據分析的行情,不同的公司和職位有不同的情況,大概介于運營、產品和開發(fā)之間吧。
2)?傳統互聯網公司我沒有待過,不敢說了解。但是從我自己對于數據分析師的了解,我猜除了分析和研究的業(yè)務有不同,本質上沒有差別。舉個例子,A股是傳統企業(yè)公司,美股是互聯網公司,2個股市不一樣,但是,作為一名投資者,對于基本面、資金面和情緒面的研究方法,邏輯推理,投資方法,我覺得是一樣的,不會有差異。但是,涉及到具體的A股和美股不同的股市,具體操作的時候,會一些區(qū)別。古話說:萬變不離其宗 。
?數據分析師日常工作,大概有如下的幾方面(當然,各公司業(yè)務發(fā)展階段不同,稍有差異),核心都是圍繞數據,挖掘其價值:
?提供基礎報表,滿足基礎需求
?分析業(yè)務和產品,提供業(yè)務運營和產品優(yōu)化建議
?提供戰(zhàn)略分析和戰(zhàn)略性報告
?開發(fā)數據產品
?基本的工作是前三個,后面一個數據產品開發(fā),主要是數據產品經理去做的,但是也不一定??赡苁欠治鰩熖嵝枨?,其他人去做。
2,技能
問:1)我目前比較熟悉 Python 的基礎數據包(Numpy,Pandas,Matplotlib 等)和 Linux Shell,Keynote、AI、Ps 做報告展現也沒啥問題,做過 5 年銷售,一年風投經理,但數學和統計較弱,英語也一般,能找到合適的數據分析工作嗎?
2) 數據分析從入門到進階的路線是什么?核心技能是什么呢?至少要懂那些東西才能上手干活?
3) SQL 在數據分析工作很重要嗎?常用的 SQL 工具有哪些呢?
4)數據挖掘和數據分析的區(qū)別是什么呢?做數據分析一定要懂數據挖掘嗎?需要懂到什么程度呢?
答:1)數據分析師職位,也有初、中、高級的區(qū)分,比如你去阿里巴巴崗位搜索數據分析師,會有數據分析師,數據分析專家等區(qū)分,所以,要求不也有,對于求職者的技能要求也不一樣。會Python,不是優(yōu)勢,反而你做過一年風投精力會給你的經歷增色,為什么呢?一個好的數據分析師,一定是一個商業(yè)分析家,正確的定義問題,思考問題,找到解決辦法,才是一名合格的分析師需要具備的技能。所以,你肯定可以找到一份數據分析的工作。
2)說到從入門到進階的路線,我個人覺得沒有一個明確和固定的路線,不像JAVA,從看《think in java》開始,到《如何治療頸椎病》結束。每個人都會分析,都有想法,也都有自己的看法。不過,分析師需要具備的技能,看值得分析師新同學關注的“軟技能”!這篇文章吧。這個是我自己的個人經驗總結,期望對你有幫助。
3)SQL主要是用來做數據提取的。目前公司的數據,很多都放在數據庫,比如MySQL,mangoDB,等等;如果是ODPS,HIVE,也是sql提取,所以,這種情況讓別人覺得SQL很重要。其實,SQL也是一個技能。我們做數據分析,必須要把數據提取出來,這個是第一步。提取出來以后,再分析,是第二步。其實,在阿里巴巴這么高大上的公司,一個分析師會SQL+EXCEL+PPT,基本就可以把活干完了。相信么? 所以,只要會SQL的基本語法,會寫SQL代碼,寫個1W行,基本SQL就不是問題了。
4)數據分析和數據挖掘,廣義的數據分析包括了數據挖掘,狹義的說呢,它們的目的一樣,都是挖掘數據的價值,但是過程和方法不一樣。數據挖掘偏重研究數據中的規(guī)律和模式,規(guī)律、模式一定要通過工具來挖掘;數據分析一般分析目標相對明確,從數據得到一些信息,不用那么深的規(guī)律的探討。做數據分析,不一定非要懂那么多數據挖掘的算法,或者機器學習。當然,技多不壓身,懂的東西越多越好。至于具體的一個業(yè)務問題的分析,一般不會涉及到復雜的數據挖掘,統計方法就夠了。
3,其他
問:1)這個書單和學習計劃怎么樣?
2)會 Python 還需要學 R 嗎?他們在做數據分析時各自的優(yōu)劣是什么呢?
答:1)這個書單和計劃,怎么說呢,挺完美。但是,要看完這些書,學會這些技術,消化掉,很難。之前值得分析師新同學關注的“軟技能”!的文章里面我也推薦了一個書單,我覺得分析師的核心技能,還是軟技能方面的,比如,正確定義問題,分析問題,找到問題的串聯點,怎么樣去解決問題,如何正確的思考問題,這些才是分析師的核心技能。所以,我特別贊同查理芒格說的一句話:不要做一名股票分析家,而要做一名商業(yè)分析家。分析師亦然。 我個人覺得完美的學習計劃,不如這樣。找一家公司的IPO報告,然后仔細的研究這個IPO的報告,研究這個公司的發(fā)展和變化,以及股票的變化,思考一些問題。用到了分析的軟件,就去學習,學完了立馬使用它去研究IPO報告,等等。這種方法,比看XX軟件學習技能好多了。
2)Python和R,一把是倚天劍,一把是屠龍刀。兩個都好。在高手那里,它們沒有半點區(qū)別。不用糾結。精通一個就夠用了。大部分的問題分析,用不到邏輯回歸和機器學習。
4,總結
其實,朋友問的幾個問題,基本涉及了數據分析師技能技能,工作內容,成長路線等等,這里簡單再總結一下:
?數據分析師,工作涉及到數據提取,數據整理,數據分析,數據報告等幾個方面。
?數據提取這塊,目前SQL是必須要掌握的,上面也提到了。另外,有些時候可能也會用到爬蟲,爬取一些數據;
?數據整理這部分,python和R,二者取其一就夠了。不多說。簡單的數據,Excel就夠用了。目前做數據分析師用Excel打天下的,估計有90%。
?數據分析,這部分理解為探索性數據分析吧,比如做一些統計圖,統計方法來分析一些問題,研究方差變化,等等。這個方面,軟技能更需要,比如問題的定義,問題的分析,等等。當然,為了更大程度的挖掘信息,會用數據挖掘的方法,等等。從外界看,貌似會建模和挖掘,就高大上了,用excel就不高大上了。貌似巴菲特用電腦只會打橋牌,不會所謂的股票挖掘和預測模型,但是,不影響他是一個偉大的投資和理財家。想想他的投資理財的回報率,親人們,你們不覺得你會excel就很牛了么?
?數據報告,好了,前面所有的提取,整理,分析,都是過程,報告才是我們做這個數據分析的一個結果。如果它有意義,對別人有幫助,OK,我們做的工作有意義了。如果它不正確,更沒有意義。前面的付出都是一江春水向東流,拜拜了。 大部分的報告,是PPT或者郵件形式。這部分,因為做個PPT不會特別復雜,大家都不關注。其實,它也是有很多技巧的。不展開了。
?最后說一點東西,關于數據分析師,舉一個巴菲特的例子。他不會挖掘算法,不會建模,但是他有一套自己的分析問題,解決問題的模型框架,他會自己去分析公司的財務數據,分析經濟發(fā)展走勢,等等。巴菲特,不是一個好的分析師么? 相信大家明白數據分析師的核心技能是什么了。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數據處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數據庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數據分析師:表結構數據 “獲取 - 加工 - 使用” 全流程的賦能者 表結構數據(如數據庫表、Excel 表、CSV 文件)是企業(yè)數字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數據分析師:解鎖表結構數據特征價值的專業(yè)核心 表結構數據(以 “行 - 列” 規(guī)范存儲的結構化數據,如數據庫表、Excel 表、 ...
2025-09-17Excel 導入數據含缺失值?詳解 dropna 函數的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數據時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數據分析與統計學領域,假設檢驗是驗證研究假設、判斷數據差異是否 “ ...
2025-09-16CDA 數據分析師:掌控表格結構數據全功能周期的專業(yè)操盤手 表格結構數據(以 “行 - 列” 存儲的結構化數據,如 Excel 表、數據 ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數據分析師:激活表格結構數據價值的核心操盤手 表格結構數據(如 Excel 表格、數據庫表)是企業(yè)最基礎、最核心的數據形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數據爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數據的科學計數法問題 為幫助 Python 數據從業(yè)者解決pd.read_csv讀取長浮點數據時的科學計數法問題 ...
2025-09-12CDA 數據分析師:業(yè)務數據分析步驟的落地者與價值優(yōu)化者 業(yè)務數據分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數據把關的實戰(zhàn)指南 在業(yè)務系統落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數據驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數據分析師與戰(zhàn)略 / 業(yè)務數據分析:概念辨析與協同價值 在數據驅動決策的體系中,“戰(zhàn)略數據分析”“業(yè)務數據分析” 是企業(yè) ...
2025-09-11Excel 數據聚類分析:從操作實踐到業(yè)務價值挖掘 在數據分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數據中挖 ...
2025-09-10統計模型的核心目的:從數據解讀到決策支撐的價值導向 統計模型作為數據分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10