
隨著大數(shù)據(jù)和人工智能時(shí)代的到來(lái),傳統(tǒng)企業(yè)開(kāi)始向數(shù)據(jù)化和智能化轉(zhuǎn)型。由此,數(shù)據(jù)分析師相關(guān)崗位的需求量逐年遞增,近兩年呈現(xiàn)出供不應(yīng)求的狀況,在未來(lái)很長(zhǎng)一段時(shí)間這種需求還將繼續(xù)保持下去。作為過(guò)來(lái)人,我也算是苦盡甘來(lái)啊。想想自己當(dāng)初為了轉(zhuǎn)行數(shù)據(jù)分析師行業(yè),付出了多少心血和汗水。
相信還有很多像我一樣計(jì)劃轉(zhuǎn)行或已經(jīng)準(zhǔn)備好轉(zhuǎn)行的朋友,為此,我特地給大家分享了我的專業(yè)數(shù)據(jù)分析師經(jīng)驗(yàn)之談,讓大家可以更加直觀地了解當(dāng)下數(shù)據(jù)分析師的行業(yè)情況和職位需求。
為了幫助大家對(duì)數(shù)據(jù)分析師相關(guān)職位的目前發(fā)展?fàn)顩r有個(gè)清晰明了的認(rèn)識(shí),本文通過(guò)分析“數(shù)據(jù)分析師”在全國(guó)招聘信息的城市需求、職業(yè)門檻、各公司要求情況,以及當(dāng)下各大企業(yè)的人才需求狀況,使用數(shù)據(jù)分析工具Python,包括數(shù)據(jù)的獲取、清洗和可視化的呈現(xiàn),就為了幫助大家更好地了解數(shù)據(jù)分析師這個(gè)職業(yè)。本文所用數(shù)據(jù)均來(lái)源于BOSS直聘的近期數(shù)據(jù)分析師的全國(guó)招聘信息。,絕對(duì)客觀真實(shí)有效!
分析流程
01
明確分析目的
明確分析目的是數(shù)據(jù)分析的首要的、關(guān)鍵的步驟。在開(kāi)始一項(xiàng)數(shù)據(jù)分析前,首先要清楚我們想解決什么問(wèn)題?通過(guò)這次分析想達(dá)到一個(gè)什么樣的效果?下面列出了本次分析的幾個(gè)目的:
1)了解各城市對(duì)數(shù)據(jù)分析師的需求;
2)數(shù)據(jù)分析師這個(gè)職業(yè)的門檻有多高;
3)了解招聘公司情況;
4)了解各行業(yè)對(duì)數(shù)據(jù)分析師的需求;
4)了解數(shù)據(jù)分析師的薪資情況。
02
獲取相關(guān)數(shù)據(jù)
明確分析目的后,接下來(lái)要做的就是為了解決這些問(wèn)題,有針對(duì)性的獲取相關(guān)數(shù)據(jù)。之所以說(shuō)“有針對(duì)性”,是因?yàn)椴⒉皇菙?shù)據(jù)越多越好,數(shù)據(jù)越多,我們的抓取、清洗成本也就越高,只有對(duì)本次分析有用的數(shù)據(jù)才是有價(jià)值的數(shù)據(jù)。因此,根據(jù)我們的分析目的,本文用Python從BOSS直聘中抓取了如下字段信息:公司名稱,公司地址,公司規(guī)模,融資情況,所屬行業(yè),職位名稱,經(jīng)驗(yàn)要求,學(xué)歷要求,薪資。源數(shù)據(jù)格式如下:
03
數(shù)據(jù)清洗與規(guī)整化
得到源數(shù)據(jù)后,還需要對(duì)其進(jìn)行清洗和規(guī)整化后才能進(jìn)行分析,一般包括清洗、轉(zhuǎn)換、合并、重塑。下面本文使用Python對(duì)源數(shù)據(jù)進(jìn)行處理:
1) 導(dǎo)入包
2) 缺失值處理
3) 刪除重復(fù)值
4) 提取城市名
5) 刪除空格
6) 提取最低薪資和最高薪資
7) 數(shù)據(jù)重塑
04
數(shù)據(jù)可視化分析報(bào)告
1. 城市需求分析
初步觀察可知,數(shù)據(jù)分析師的需求主要集中在大城市,其中排名前十的分別是北京、上海、深圳、杭州、南京、廣州、東莞、合肥、天津、武漢。其中北京的需求遠(yuǎn)遠(yuǎn)超過(guò)其它城市,接近上海和深圳的需求總和。
數(shù)據(jù)分析師職位在城市地理分布上,主要集中于北上廣深、長(zhǎng)江三角洲、沿海地區(qū)。中國(guó)內(nèi)陸地區(qū)需求較少,一般集中于省會(huì)城市。
2. 職業(yè)門檻分析
在學(xué)歷要求上,數(shù)據(jù)分析師的門檻相對(duì)較高,80.2%的公司要求至少本科學(xué)歷,4.8%的公司要求碩士學(xué)歷。因此對(duì)想從事數(shù)據(jù)分析師職業(yè)的人員來(lái)說(shuō),本科學(xué)歷是必要的敲門磚。
在工作經(jīng)驗(yàn)要求上,大部分公司對(duì)工作經(jīng)驗(yàn)都有較高要求,其中3-5年工資經(jīng)驗(yàn)的數(shù)據(jù)分析師最受歡迎,需求達(dá)到37.9%;其次就是1-3年經(jīng)驗(yàn)的數(shù)據(jù)分析師,需求達(dá)到31.1%。因此,一定的行業(yè)工作經(jīng)驗(yàn)?zāi)軒椭鷶?shù)據(jù)分析師求職者快速找到工作 ,而應(yīng)屆生和無(wú)工作經(jīng)驗(yàn)者只有提高自己的專業(yè)技能,才能獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。
3. 公司情況分析
對(duì)于招聘公司的融資情況上,上市公司居多,達(dá)到33.4%;在公司的規(guī)模上,大公司對(duì)數(shù)據(jù)分析師的需求更多,其中1000-9999人規(guī)模的公司最多,達(dá)到45.4% ,其次是10000人以上規(guī)模的公司,達(dá)33.8%。
4. 行業(yè)需求分析
在下面詞云圖中可以看出,數(shù)據(jù)分析師涉及的行業(yè)十分廣泛,供求職者的選擇空間很大,其中各行業(yè)中,互聯(lián)網(wǎng)、電子商務(wù)、金融、醫(yī)療健康、計(jì)算機(jī)軟件等行業(yè)的需求量最高。
5. 薪資分析
(1)工作經(jīng)驗(yàn)和學(xué)歷對(duì)薪資的影響
總的來(lái)說(shuō),工作經(jīng)驗(yàn)的長(zhǎng)短和學(xué)歷的大小基本跟薪資的高低是成正比的,工作經(jīng)驗(yàn)越長(zhǎng),學(xué)歷越高,薪資也會(huì)越高。
在工作經(jīng)驗(yàn)上,擁有十年以上經(jīng)驗(yàn)者平均起薪已經(jīng)超過(guò)25000,5-10經(jīng)驗(yàn)者平均起薪在20000左右,3-5年經(jīng)驗(yàn)者平均起薪接近15000了,而三年以下和無(wú)經(jīng)驗(yàn)者平均起薪則在10000以下。由此可看出,數(shù)據(jù)分析師對(duì)工作經(jīng)驗(yàn)的要求還是比較高的,對(duì)行業(yè)和業(yè)務(wù)熟悉的人薪資會(huì)更高,同時(shí)也說(shuō)明這個(gè)職業(yè)有很大的上升空間,“越老越值錢”,看重資歷。
在學(xué)歷上,本科和碩士的平均起薪相差2000左右,差別不是很大,但本科以下學(xué)歷,平均起薪就相對(duì)較低了,一般不超過(guò)6000。
因此,本科學(xué)歷是數(shù)據(jù)分析師高薪的門檻,擁有本科學(xué)歷和3年以上工作經(jīng)驗(yàn)是數(shù)據(jù)分析師高薪的敲門磚。
下面展示的是數(shù)據(jù)分析師職業(yè)需求前十的城市起薪的分布狀況。容易看出,北京、上海、深圳、杭州的平均起薪都在15000左右,而廣州只有10000左右,南京則在7500左右。
對(duì)于北京,數(shù)據(jù)分析師的平均起薪分布對(duì)稱,比較符合正態(tài)分布;上海、深圳、南京呈右偏分布,其中上海、深圳高薪資職位相對(duì)較多,南京有個(gè)別公司起薪異常高。杭州、廣州呈左偏分布,半數(shù)職位起薪在10000以下,個(gè)別職位薪資不超過(guò)5000,遠(yuǎn)遠(yuǎn)低于平均水平。
因此,在北京、上海、深圳三個(gè)城市能有更大的概率找到高薪的數(shù)據(jù)分析師職位;其次是杭州、廣州,雖有部分公司薪資較低,但平均工資還是比較可觀;而南京雖然需求較多,但高薪職位相對(duì)較少,大部分職位工資都不超過(guò)10000,集中在3000-7500中間。
05
分析總結(jié)
本文從多角度分析了BOSS直聘近期數(shù)據(jù)分析師的招聘信息情況,對(duì)數(shù)據(jù)分析師有如下幾點(diǎn)總結(jié):
1)北上廣深、長(zhǎng)江三角洲、沿海地區(qū)是數(shù)據(jù)分析師的集中地區(qū),其中,北京的需求遠(yuǎn)遠(yuǎn)超過(guò)其它地區(qū),若想從事數(shù)據(jù)分析師職業(yè),在北京機(jī)會(huì)最多。
2)本科學(xué)歷、3-5年以上工作經(jīng)驗(yàn)的數(shù)據(jù)分析師成為最受公司歡迎的“香餑餑”,并且平均薪資也相對(duì)較高,在15000左右。
3)上市公司、1000-9999的大公司對(duì)數(shù)據(jù)分析師的需求更高;
4)互聯(lián)網(wǎng)、電子商務(wù)、金融、醫(yī)療健康是數(shù)據(jù)分析師首選的幾大行業(yè)。
5)在北京、上海、深圳尋找高薪職位的概率更大。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10