
When looking at data scientist salaries and data science roles, it became obvious that there are different, more specific facets within data science. These facets relate to unique job positions, specifically, machine learning operations, NLP, data engineering, and data science itself. Of course, there are even more specific positions than these, but these can give you a general summary of what to expect if you land a job in one of these positions. I wanted to pick these four roles, too, because they can be separated well, almost as if it was there was a clustering algorithm that found jobs that were the most different between one another but that were also in the same population. Below, I will be discussing the average base pay with a low and high range, as well as respective seniority levels, the number of estimates used to determine these numbers, and expected skills and experiences for each role.
機(jī)器學(xué)習(xí)工程師傾向于將已經(jīng)研究和構(gòu)建的數(shù)據(jù)科學(xué)模型應(yīng)用到生產(chǎn)環(huán)境中,通常包括軟件工程和機(jī)器學(xué)習(xí)算法知識(shí)。話雖如此,你可以想象得到相當(dāng)不錯(cuò)的薪水。這個(gè)特別的估計(jì)來自于GlassDoor[3]。
根據(jù)大約1900提交的工資,有以下廣泛的范圍:
正如你所看到的,這是一個(gè)范圍,就像任何職位一樣,你的經(jīng)驗(yàn)越多,工資越高也就不足為奇了。除了多年的經(jīng)驗(yàn),你工作的州,你雇用的技能,公司也會(huì)努力創(chuàng)造最終的工資數(shù)額--所有這些職位都是如此。為了獲得更多的粒度,我們可以查看不同的資歷級(jí)別,以便了解級(jí)別的增加與工資數(shù)額的關(guān)系:
以下是一些來自個(gè)人經(jīng)驗(yàn)的技能,您可以期望在機(jī)器學(xué)習(xí)職位上使用:
通常被稱為NLP工程師,這個(gè)角色通常專注于將數(shù)據(jù)科學(xué)模型或機(jī)器學(xué)習(xí)算法應(yīng)用于文本數(shù)據(jù)。NLP工作的一些例子是主題建模、大量文本、語(yǔ)義分析和chatbot代理。話雖如此,你也可以想象出相當(dāng)不錯(cuò)的工資--然而,這個(gè)工資細(xì)目將低于機(jī)器學(xué)習(xí)工程師,很可能是因?yàn)檫@個(gè)角色不太包容,更專注于數(shù)據(jù)科學(xué)中的特定主題。這個(gè)特別的估計(jì)也來自于Glassdoor[5]。
根據(jù)大約20提交的工資,有以下廣泛的范圍:
值得注意的是,報(bào)告的工資數(shù)額相當(dāng)?shù)?,所以?duì)這個(gè)范圍持懷疑態(tài)度,但盡管如此,對(duì)這個(gè)工資仍然有很高的信心。
所有這些數(shù)量都低于機(jī)器學(xué)習(xí),然而,與大多數(shù)其他角色相比,它們?nèi)匀幌喈?dāng)高。
以下是一些來自個(gè)人經(jīng)驗(yàn)的技能,你可以期望在自然語(yǔ)言處理工程師的職位上使用:
也許一個(gè)更常見的角色是數(shù)據(jù)工程,它與數(shù)據(jù)科學(xué)比在數(shù)據(jù)科學(xué)之下更相關(guān)。然而,這個(gè)角色對(duì)數(shù)據(jù)科學(xué)工作來說仍然至關(guān)重要,有時(shí),數(shù)據(jù)科學(xué)家可以期望知道數(shù)據(jù)工程師所知道的大部分內(nèi)容,所以我將在本文分析中包括它。數(shù)據(jù)工程的一些示例包括創(chuàng)建存儲(chǔ)最終用于數(shù)據(jù)科學(xué)模型的數(shù)據(jù)的ETL作業(yè),以及自動(dòng)存儲(chǔ)模型結(jié)果和執(zhí)行查詢優(yōu)化。這個(gè)特別的估計(jì)也來自于Glassdoor[7]。
根據(jù)大約~6,800提交的工資,有以下廣泛的范圍:
這個(gè)范圍更類似于自然語(yǔ)言處理工程師的角色,然而,它可能與日常工作中的實(shí)際工作角色相距最遠(yuǎn)。同樣重要的是要注意,這個(gè)職位涉及到相當(dāng)多的估計(jì)。
以下是一些來自個(gè)人經(jīng)驗(yàn)的技能,您可以期望在數(shù)據(jù)工程師職位上使用:
最后,但并非最不重要的,是數(shù)據(jù)科學(xué)家的角色。雖然這個(gè)角色看起來是最一般的,但實(shí)際上也可以是具體的,通常主要由模型構(gòu)建過程組成--有時(shí)需要數(shù)據(jù)工程和機(jī)器學(xué)習(xí)工程師操作,但可能性較小--但仍然可能涉及自然語(yǔ)言處理方面的專業(yè)(通常如果重點(diǎn)是NLP,那么數(shù)據(jù)科學(xué)家將以此為標(biāo)題--但不是一直)。這個(gè)角色還可以有更多的可變性,所以我們也可以期待一個(gè)廣泛的范圍。這個(gè)特別的估計(jì)也來自于Glassdoor[9]。
根據(jù)大約~16,200提交的工資,有以下廣泛的范圍:
出人意料地低于預(yù)期,這一角色在本分析中的大多數(shù)其他角色附近。話雖如此,它可能是對(duì)離群值最真實(shí)和穩(wěn)健的,因?yàn)樗瞧駷橹固峤粊斫M成這些工資數(shù)額的最多的工資數(shù)額。
以下是一些來自個(gè)人經(jīng)驗(yàn)的技能,您可以期望在數(shù)據(jù)科學(xué)職位上使用:
While these roles can have several similarities and differences, the same can be said about their salary ranges. Nearly three of the four salaries were similar, with one standing out. That role was machine learning engineer —why is that?My understanding is that this role requires a knowledge of most data science concepts, and especially their output, as well the software engineering involved around deployment — that is a lot to know and employ, so it makes sense why a role that composes both software engineering and data science pays so well. In addition to the salary breakdown of each data science role — or similar to data science in some way, were the skills that you can expect to employ, so that you can have a better idea of the role and how that relates to the salary amount.
總結(jié)一下,以下是我們分析的四個(gè)職位,以及你可以期望使用的技能:
* 機(jī)器學(xué)習(xí)工程師 * 自然語(yǔ)言處理工程師 * 數(shù)據(jù)工程師 * 數(shù)據(jù)科學(xué)家
我希望你覺得我的文章既有趣又有用。如果你同意這些數(shù)字和范圍,請(qǐng)隨時(shí)在下面發(fā)表評(píng)論--為什么或?yàn)槭裁床??你認(rèn)為有一個(gè)角色,尤其是,離現(xiàn)實(shí)如此之遠(yuǎn)嗎?你還能想到哪些數(shù)據(jù)科學(xué)角色會(huì)有不同的工資細(xì)分嗎?一個(gè)角色的其他因素會(huì)影響薪水嗎?
這些薪金是在美國(guó)報(bào)告的,因此它們是以美元數(shù)額計(jì)算的。我與這些公司中的任何一家都沒有關(guān)聯(lián)。
請(qǐng)隨時(shí)查看我的個(gè)人資料和其他文章,并在LinkedIn上聯(lián)系我。
[1] Photo byThought CatalogonUnsplash, (2018)
[2]Photo Byassed PhotographyonUnsplash,(2018)
[3]Glassdoor,Inc.,機(jī)器學(xué)習(xí)工程師工資,(2008-2021)
[4]Photo Bybatrick TomassoonUnsplash,(2016)
[5]Glassdoor,Inc.自然語(yǔ)言處理工程師工資,(2008-2021)
[6]Caspar Camille RubinonUnsplash的照片,(2017)
[7]Glassdoor,Inc.,數(shù)據(jù)工程師工資,(2008-2021)
[8]照片byDaria NepriakhinaonUnsplash,(2017)
[9]Glassdoor,Inc.,數(shù)據(jù)科學(xué)家工資,(2008-2021)
Bio: Matthew Przybyla is Senior 數(shù)據(jù)科學(xué)家 at Favor Delivery, and a freelance technical writer, especially in data science.
原創(chuàng)。經(jīng)允許轉(zhuǎn)發(fā)。
相關(guān):
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10