
When looking at data scientist salaries and data science roles, it became obvious that there are different, more specific facets within data science. These facets relate to unique job positions, specifically, machine learning operations, NLP, data engineering, and data science itself. Of course, there are even more specific positions than these, but these can give you a general summary of what to expect if you land a job in one of these positions. I wanted to pick these four roles, too, because they can be separated well, almost as if it was there was a clustering algorithm that found jobs that were the most different between one another but that were also in the same population. Below, I will be discussing the average base pay with a low and high range, as well as respective seniority levels, the number of estimates used to determine these numbers, and expected skills and experiences for each role.
機器學習工程師傾向于將已經(jīng)研究和構(gòu)建的數(shù)據(jù)科學模型應(yīng)用到生產(chǎn)環(huán)境中,通常包括軟件工程和機器學習算法知識。話雖如此,你可以想象得到相當不錯的薪水。這個特別的估計來自于GlassDoor[3]。
根據(jù)大約1900提交的工資,有以下廣泛的范圍:
正如你所看到的,這是一個范圍,就像任何職位一樣,你的經(jīng)驗越多,工資越高也就不足為奇了。除了多年的經(jīng)驗,你工作的州,你雇用的技能,公司也會努力創(chuàng)造最終的工資數(shù)額--所有這些職位都是如此。為了獲得更多的粒度,我們可以查看不同的資歷級別,以便了解級別的增加與工資數(shù)額的關(guān)系:
以下是一些來自個人經(jīng)驗的技能,您可以期望在機器學習職位上使用:
通常被稱為NLP工程師,這個角色通常專注于將數(shù)據(jù)科學模型或機器學習算法應(yīng)用于文本數(shù)據(jù)。NLP工作的一些例子是主題建模、大量文本、語義分析和chatbot代理。話雖如此,你也可以想象出相當不錯的工資--然而,這個工資細目將低于機器學習工程師,很可能是因為這個角色不太包容,更專注于數(shù)據(jù)科學中的特定主題。這個特別的估計也來自于Glassdoor[5]。
根據(jù)大約20提交的工資,有以下廣泛的范圍:
值得注意的是,報告的工資數(shù)額相當?shù)?,所以對這個范圍持懷疑態(tài)度,但盡管如此,對這個工資仍然有很高的信心。
所有這些數(shù)量都低于機器學習,然而,與大多數(shù)其他角色相比,它們?nèi)匀幌喈敻摺?
以下是一些來自個人經(jīng)驗的技能,你可以期望在自然語言處理工程師的職位上使用:
也許一個更常見的角色是數(shù)據(jù)工程,它與數(shù)據(jù)科學比在數(shù)據(jù)科學之下更相關(guān)。然而,這個角色對數(shù)據(jù)科學工作來說仍然至關(guān)重要,有時,數(shù)據(jù)科學家可以期望知道數(shù)據(jù)工程師所知道的大部分內(nèi)容,所以我將在本文分析中包括它。數(shù)據(jù)工程的一些示例包括創(chuàng)建存儲最終用于數(shù)據(jù)科學模型的數(shù)據(jù)的ETL作業(yè),以及自動存儲模型結(jié)果和執(zhí)行查詢優(yōu)化。這個特別的估計也來自于Glassdoor[7]。
根據(jù)大約~6,800提交的工資,有以下廣泛的范圍:
這個范圍更類似于自然語言處理工程師的角色,然而,它可能與日常工作中的實際工作角色相距最遠。同樣重要的是要注意,這個職位涉及到相當多的估計。
以下是一些來自個人經(jīng)驗的技能,您可以期望在數(shù)據(jù)工程師職位上使用:
最后,但并非最不重要的,是數(shù)據(jù)科學家的角色。雖然這個角色看起來是最一般的,但實際上也可以是具體的,通常主要由模型構(gòu)建過程組成--有時需要數(shù)據(jù)工程和機器學習工程師操作,但可能性較小--但仍然可能涉及自然語言處理方面的專業(yè)(通常如果重點是NLP,那么數(shù)據(jù)科學家將以此為標題--但不是一直)。這個角色還可以有更多的可變性,所以我們也可以期待一個廣泛的范圍。這個特別的估計也來自于Glassdoor[9]。
根據(jù)大約~16,200提交的工資,有以下廣泛的范圍:
出人意料地低于預(yù)期,這一角色在本分析中的大多數(shù)其他角色附近。話雖如此,它可能是對離群值最真實和穩(wěn)健的,因為它是迄今為止提交來組成這些工資數(shù)額的最多的工資數(shù)額。
以下是一些來自個人經(jīng)驗的技能,您可以期望在數(shù)據(jù)科學職位上使用:
While these roles can have several similarities and differences, the same can be said about their salary ranges. Nearly three of the four salaries were similar, with one standing out. That role was machine learning engineer —why is that?My understanding is that this role requires a knowledge of most data science concepts, and especially their output, as well the software engineering involved around deployment — that is a lot to know and employ, so it makes sense why a role that composes both software engineering and data science pays so well. In addition to the salary breakdown of each data science role — or similar to data science in some way, were the skills that you can expect to employ, so that you can have a better idea of the role and how that relates to the salary amount.
總結(jié)一下,以下是我們分析的四個職位,以及你可以期望使用的技能:
我希望你覺得我的文章既有趣又有用。如果你同意這些數(shù)字和范圍,請隨時在下面發(fā)表評論--為什么或為什么不?你認為有一個角色,尤其是,離現(xiàn)實如此之遠嗎?你還能想到哪些數(shù)據(jù)科學角色會有不同的工資細分嗎?一個角色的其他因素會影響薪水嗎?
這些薪金是在美國報告的,因此它們是以美元數(shù)額計算的。我與這些公司中的任何一家都沒有關(guān)聯(lián)。
請隨時查看我的個人資料和其他文章,并在LinkedIn上聯(lián)系我。
[1] Photo byThought CatalogonUnsplash, (2018)
[2]Photo Byassed PhotographyonUnsplash,(2018)
[3]Glassdoor,Inc.,機器學習工程師工資,(2008-2021)
[4]Photo Bybatrick TomassoonUnsplash,(2016)
[5]Glassdoor,Inc.自然語言處理工程師工資,(2008-2021)
[6]Caspar Camille RubinonUnsplash的照片,(2017)
[7]Glassdoor,Inc.,數(shù)據(jù)工程師工資,(2008-2021)
[8]照片byDaria NepriakhinaonUnsplash,(2017)
[9]Glassdoor,Inc.,數(shù)據(jù)科學家工資,(2008-2021)
Bio: Matthew Przybyla is Senior 數(shù)據(jù)科學家 at Favor Delivery, and a freelance technical writer, especially in data science.
原創(chuàng)。經(jīng)允許轉(zhuǎn)發(fā)。
相關(guān):
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10CDA 數(shù)據(jù)分析師:商業(yè)數(shù)據(jù)分析實踐的落地者與價值創(chuàng)造者 商業(yè)數(shù)據(jù)分析的價值,最終要在 “實踐” 中體現(xiàn) —— 脫離業(yè)務(wù)場景的分 ...
2025-09-10機器學習解決實際問題的核心關(guān)鍵:從業(yè)務(wù)到落地的全流程解析 在人工智能技術(shù)落地的浪潮中,機器學習作為核心工具,已廣泛應(yīng)用于 ...
2025-09-09SPSS 編碼狀態(tài)區(qū)域中 Unicode 的功能與價值解析 在 SPSS(Statistical Product and Service Solutions,統(tǒng)計產(chǎn)品與服務(wù)解決方案 ...
2025-09-09