
你真的無法避免,是嗎?你看哪里就提到哪里。你的LinkedIn訂閱、就業(yè)市場、新聞訂閱、試圖吸引你注意力的教育項目(還有你的入學費)。但數據科學到底是什么?它通常被描述得很模糊,留下了許多不盡如人意的地方。本指南將試圖避免所有這些,并為您提供關于“什么是數據科學?”的最佳、最直接和明確的答案。以及“數據科學家是做什么的?”。
那么,數據科學家是做什么的呢?為了回答這個問題,我們將帶領您了解數據科學工作的各個方面。
數據科學的作用是利用每個公司現(xiàn)在收集的深不可測的大量數據,并將其轉化為可理解和有用的信息。將數據轉換為信息是通過使用諸如機器學習(ML)、人工智能(AI)和統(tǒng)計分析等技術來完成的。所有這些都是為了解決現(xiàn)實世界的問題?,F(xiàn)實世界通常被轉化為業(yè)務問題。這意味著公司使用數據科學來做出更合理的商業(yè)決策,并獲得更多利潤。
既然我們已經討論了數據科學家的角色,現(xiàn)在是時候問一下這在實踐中意味著什么了。數據科學家是做什么的?一個直接的問題應該得到直接的回答。
數據科學家:
數據科學中最通用的職位頭銜是數據科學家,它涵蓋了數據科學領域中使用的所有技能。作為一名數據科學家包括了上述所有的責任。然而,如果你在數據科學領域工作,這并不是你能擁有的唯一職位。
還有許多其他職位頭銜取決于資歷、公司組織、規(guī)模等。最重要的是,這些職位頭銜取決于他們所關注的數據科學領域。你可以把它看作是數據科學家是數據科學的原始湯,所有其他的職位頭銜都源于它。
一般來說,數據科學領域的職位可以分為以下兩類:
在我們的博客帖子中有關于每一個數據科學工作的非常詳細的信息,我們將在這里提到。使用該職位可以找到每個職位所需的詳細職務描述和技能。
當我們談論數據提供者時,我們談論的是專注于原始數據、數據基礎設施、數據加載和數據庫的工作。
例如,這一類別中的數據科學職位有:數據建模師、數據工程師、數據庫管理員、數據架構師和軟件工程師。以這樣或那樣的方式,它們都確保數據科學中的另一類工作(數據用戶)可以不間斷地訪問數據,這為數據用戶建立基礎奠定了基礎。
當然,所有這些數據提供者作業(yè)在它們之間有不同的目的。
數據建模器
例如,數據建模師創(chuàng)建概念、邏輯和物理數據庫模型,并參與數據庫實現(xiàn)。
數據工程師
數據工程師更關心的是數據基礎設施及其開發(fā)和維護,包括數據倉庫和提取、轉換和加載數據(ETL/ELT)。
查看我們關于數據工程師vs數據科學家的帖子,該帖子可以解釋數據科學家和數據工程師的共同點和不同點。
數據庫管理員
根據數據基礎結構,數據庫管理員確保數據和數據庫的完整性和安全性。這包括授予和撤銷對數據的訪問權、備份數據庫、還原數據等。
軟件工程師
在上述職位所提供的數據基礎設施之上,坐著軟件工程師。他們設計、開發(fā)、測試和維護作為接口數據的軟件,用戶將使用這些接口數據來充分利用底層數據和數據基礎設施。
數據架構師
數據架構師提供全局并協(xié)調所有這些數據提供者。他們的工作是理解公司的流程,這樣他們就可以計劃、實施和改進公司數據處理基礎設施的體系結構。這意味著為數據如何在不同的入口點進入公司提供解決方案。數據以哪種格式輸入,使用哪種軟件處理(如果有的話),以及如何將數據轉換并加載到數據庫或數據倉庫中。如何被公司使用直到點數據成為公司的輸出。
數據用戶利用現(xiàn)有數據和數據基礎設施向各類股東提供信息。它們是數據提供者和決策者之間相當“工程”工作的紐帶,決策者通常不太在技術方面。
數據科學中的數據用戶,除了數據科學家之外,還包括數據分析師、統(tǒng)計學家、BI開發(fā)人員、業(yè)務分析師、數量分析師、營銷科學家、機器學習工程師、研究科學家等。同樣,他們在公司中都有不同的目的。
數據分析師
例如,數據分析員側重于報告、定期和特別分析。他們使用數據并將其匯總成報告格式。這使得不太懂技術的用戶有可能使用這些數據并了解公司業(yè)務的各個方面。數據分析員主要使用歷史數據。
統(tǒng)計學家
統(tǒng)計學家在分析數據的方式上也與數據分析家相似。然而,他們更關心的是預測未來,而不是解釋過去。他們用數據來觀察將要發(fā)生的事情,而不是已經發(fā)生的事情。為了做到這一點,他們將統(tǒng)計方法應用于數據,如假設檢驗和概率。那樣的話,統(tǒng)計學家也類似于數據科學家。不同的是,與數據科學家不同,他們不建立模型,只專注于數據科學的統(tǒng)計部分。
BI開發(fā)人員
BI開發(fā)人員是在BI工具中開發(fā)(設計、構建和維護)儀表板的人員,其目的是實現(xiàn)數據可視化和報告。他們做報告的方式類似于數據分析師。然而,他們也有一些工程技能,他們使用這些技能來ETL數據和構建用戶界面,就像數據工程師和軟件工程師分別做的那樣。
業(yè)務分析師
業(yè)務分析師專注于報告,就像數據分析師一樣。然而,他們通常專注于內部報告,以發(fā)現(xiàn)公司業(yè)務流程中的弱點并加以改進,數據分析師并不總是這樣。
量化分析師
定量分析師通常是專注于金融數據的數據科學家。他們將分析它并建立各種金融市場的模型,如貸款、股票、債券、外匯等。他們的分析將用于決定交易策略、可行的投資和風險管理。
營銷科學家
市場營銷科學家同樣是數據科學家,他們只處理一種類型的數據。在這種情況下,是營銷數據。像任何數據科學家一樣,他們會分析這些數據,并試圖找到模式和趨勢來解釋和預測客戶行為,這有助于解決營銷和銷售問題。
機器學習科學家
機器學習科學家是數據科學家的某種延伸。當數據科學家更關心建立模型的理論部分時,數據工程師將這些模型付諸實踐。他們獲取原型模型并將其部署到生產中。這涉及到工程人工智能軟件和算法,這些軟件和算法將使機器學習模型在實踐中發(fā)揮作用。
研究科學家
雖然機器學習工程師是這類數據科學家中的實踐者,但研究科學家是理論家。研究科學家的工作是理解計算原理和由此產生的問題。為了解決這些問題,他們改進或創(chuàng)建了全新的算法和編程語言。
在下面的圖片中,有一個例子說明了你的數據科學家職業(yè)道路可能是什么樣子的。這并不意味著這是一個單向的旅程(根本不必是一個旅程?。┗蛘哌@些職位頭銜不能互換,不能以不同的方式在之間移動。這只是一個概述,看一看,然后我們會跟著做一些解釋。
數據科學發(fā)現(xiàn)自己處于統(tǒng)計學、數學和計算機科學的十字路口。還有其他一些學科。因此,至少在這些領域接受教育是一個很好的起點。
然而,我們不能寫出適用于每個應聘者和招聘廣告的指南。一般的經驗法則是:至少獲得學士學位,才能在數據科學就業(yè)市場上有一個良好的起點。然后結合工作經驗。兩者的良好平衡總是一個你不會出錯的食譜。當然,接受更多的教育和更多的經驗總是會讓你處于更好的位置;這并不奇怪。讓我們來看看學歷/學位要求是什么:
學士學位/碩士學位
如果你想在數據科學領域建立一個職業(yè)生涯,至少擁有學士學位是個好主意。擁有學士學位或碩士學位對獲得數據科學方面的任何工作都有好處,大多數招聘廣告都要求這種教育水平。你的學位應該是相關的量化領域,如統(tǒng)計學、數學、計算機科學、工程、IT、經濟學、編程等。當然,這取決于職位頭銜和資歷水平。
此外,根據工作的不同,你可能會從一些不同領域的學位中獲得好處。也許人文學科,如哲學、社會學、心理學。它們可能很有用(有時甚至是必需的?。┤绻阆氤蔀橐幻噲D理解和預測人類行為的營銷科學家。研究科學家有時可以研究與倫理和人類行為有很深聯(lián)系的計算原理。
根據職位描述和資歷,如果你有金融、商業(yè)或類似的學位,這也是有益的。也許你在處理財務數據,而你是高層,所以除了你的技術技能之外,擁有一些領導力、商業(yè)常識和教育也變得很重要。
雖然學士學位通常是招聘廣告中要求的最低教育水平,但有時并不是唯一的教育水平。
博士學位
有博士學位。不會影響你得到上面任何工作的機會。多受教育總是更好。
然而,有時這一級別不僅很好,而是必需的。例如,獲得博士學位將是一個好主意。如果你想做一個ML工程師或任何其他數學密集型的工作。
此外,研究科學家需要在計算機科學理論、原理和研究方法方面有很強的能力。這就是為什么博士。是這個職位經常需要的。
訓練營
雖然正規(guī)教育在招聘廣告中經常被要求,但這并不意味著它總是必要的。如果你在數據科學的某些方面經驗豐富,但沒有在這一領域接受過正規(guī)教育,這并不意味著你不能從事數據科學家的工作。一般來說,職位越高,你的教育就越不重要。重要的是你在以前的工作中做了什么,你是怎么做的,你能給新的工作帶來什么技能。
這里有一個第22條軍規(guī)。你需要一份工作來獲得經驗和提高技能。如果你沒有經驗,沒有技術技能,你就找不到工作。幸運的是,有一個解決辦法:新兵訓練營。
它們是獲得數據科學適當技能的良好起點。他們不需要技術學士學位或碩士學位。這是偉大的任何人誰沒有受過正規(guī)教育,并想開始在數據科學的職業(yè)生涯。它們也適用于通過實踐漫步進入數據科學的人。這樣,他們就可以對他們已經在實踐中做的事情有一個更結構化和理論上的背景,或者提高他們已經存在的技能。
說到工作經驗,開始獲得工作經驗總是最難的。一旦你開始工作并在工作中學習,跳槽和拓寬專業(yè)領域就變得更容易了。筑牢基礎很重要。當開始從事數據科學時,人們通常是從數據分析師開始的。
從那時起,他們可以選擇進入我們前面討論過的兩個方向:作為數據提供者工作或作為數據用戶工作。上圖中重要的一點是,當你從左到右時,職位的資歷會上升,你的薪水也會上升。我們一會兒再談工資問題。讓我們先來看看一兩個例子,看看你的職業(yè)生涯會是什么樣子。
假設你從數據分析師開始。經過幾年的數據工作,并找到了自己的數據庫解決方案,您理解了數據庫原理,因此決定成為一名數據建模師或數據庫管理員。在其中一個職位上工作可以獲得更多的經驗,并且可以參與幾個關于數據基礎設施的項目。然后你得到提升,成為一個數據架構師,例如。
或者你從統(tǒng)計學家開始。在一家公司呆了幾年后,你決定是時候改變了。但你真的很喜歡你所在的公司。而且你真的很喜歡你去年參與的幾個營銷項目。你搬到一個營銷部門,只處理營銷數據,然后成為一名營銷科學家。話說回來,是時候改變了;你對機器學習產生了興趣,成為了一名數據科學家。幾年后,你想回到學校獲得博士學位。你辭掉了這份工作,全身心地投入到獲得博士學位的工作中。這一點,結合您豐富的工作經驗,使您意識到您希望以一種不同的,也許是理論的方式為數據科學做出貢獻。然后你就成了研究科學家。
這些只是你職業(yè)生涯的例子。任何與實際的人和他們的職業(yè)相似都純屬巧合。你的職業(yè)生涯將取決于你的背景、你的能力、你的興趣、你在你(或其他)公司的機會、公司的規(guī)模、組織、靈活性,是的,還有一點點運氣。
從長遠來看,你選擇的任何方式都能讓你受益。請記住,所有這些工作都是數據科學的一部分,所以只有當您想要在數據科學領域中做一些新的事情時,在數據科學的一個領域中擁有更多的經驗才是有益的。
當然,要獲得經驗,你首先需要一份工作。為了得到一份工作,你必須經歷通常繁瑣的求職面試過程。為了讓這種經歷盡可能地無痛,你需要做好準備。雖然沒有什么比面試經驗更好的了,但通過自己的codingandnoncoding面試問題會讓你有一個很好的起跑點。
在數據科學中,以下技能是必須具備的:
查看我們關于最受歡迎的數據科學技能的帖子,了解作為一名數據科學家,您必須具備哪些數據科學技術技能和業(yè)務技能。
在選擇職業(yè)時,除了你的興趣和環(huán)境之外,薪水也是一個因素。
Jobted援引美國勞工統(tǒng)計局(BLS)的數據稱,美國的平均年薪約為53.5K。
那么數據科學的工作與此相比如何呢?例如,Glassdoor datashows數據分析師的平均年薪為7000萬美元。即使是這份(平均)收入最低的數據科學工作,你的收入也會比美國平均水平高出15k美元以上。這多了30%!
作為數據科學領域收入最高的工作之一,數據科學家的平均收入可以達到13.9萬美元,比平均水平高出1.5倍以上。即使是報告的最低工資也是美國平均工資的兩倍,而工資可以高達17.1萬美元。這甚至不是數據科學中收入最高的工作。
教育、知識和技能確實會有回報,如果你想知道你應該投資于職業(yè)發(fā)展或改變的話。以下是以美元計算的工作職位和平均工資概述。
Data analyst | $70k |
Database administrator | $84k |
Data modeler | $94k |
Software engineer | $108k |
Data engineer | $113k |
Data architect | $119k |
Statistician | $89k |
Business intelligence (BI) developer | $92k |
Marketing scientist | $94k |
Business analyst | $77k |
Quantitative analyst | $112k |
Data scientist | $139k |
Research scientist | $142k |
Machine learning engineer | $189k |
根據你工作的公司,你可以期望這些基本工資通過不同的福利來增加,如現(xiàn)金和股票獎金、健康和人壽保險等。
您可以在我們的一篇博客文章中找到關于數據科學薪酬的更詳細信息--數據科學家賺多少錢?。
通常,高需求和獲得相當豐厚的報酬是有代價的。不,在數據科學中并不都是樂觀的。雖然數據科學家通常每周工作40小時,但偶爾需要投入很長時間。同樣,這取決于公司、組織、行業(yè)和其他眾多因素。但最常見的情況是,它與工作描述和它的周期性有關,這意味著你將在完全放松和輕松的時期和每周必須投入50-60個工作小時的高峰期之間取得平衡。
這是因為數據科學任務通常涉及項目,這意味著在嚴格的最后期限內解決問題。隨著最后期限的臨近,工作量通常會增加,這時數據科學家不得不投入額外的時間。
擁有相關的教育和技術技能,當然是成為數據科學家的先決條件。要完成第一步,請遵循我們在討論如何從頭開始成為一名數據科學家時提供的有用建議。但這會讓你成為一個偉大的數據科學家嗎?不一定。
數據科學的重點是解決現(xiàn)實生活中的問題。你可以擁有世界上所有的技術技能,但如果你不能利用那些輝煌的技能來想出一個解決方案,那又有什么意義呢?或者你想出了一個解決方案,但沒有人理解它并使用它。你真的解決問題了嗎?不,你沒有。
技術技能是用來解決問題的,磨練它們的最好方法之一是創(chuàng)建一個你自己的數據分析項目。然而,你也需要軟技能。想出一個解決方案有點夾在數據科學家工作的另外兩個重要階段之間。
要成為一名偉大的數據科學家,您需要:
幼稚
我們不是在說成為一個被寵壞的孩子。孩子氣意味著好奇,問問題,想學,愛玩。
你需要有好奇心,接受自己并不是什么都懂,并且愿意學習。要做到這一點,你必須像孩子一樣:問問題,直到他們得到他們滿意的答案。你需要成為“為什么”的人。只有這樣,你才能理解業(yè)務問題,不同的人,部門和客戶的需求。一旦你理解了它們,使用你的技術技能就變成了,嗯,技術性。
當你想出一個解決方案時,你需要對如何展示你可能非常復雜的解決方案表現(xiàn)得有趣和富有想象力,以便其他人能夠理解并使用它。
溝通
溝通是第一技能的自然延伸。你需要有效地溝通,提出正確的問題,以可理解的方式提出你的想法和解決方案。當人們覺得你愿意接受建議,你在傾聽他們,并尊重他們時,他們會更多地參與項目。他們愿意更詳細地解釋他們的(業(yè)務)需求和問題,使你更容易正確地理解對你的要求。
當然,如果您不能解釋數據科學解決方案是如何工作的,它如何使用戶受益,以及他們如何使用它,那么就沒有必要提出一個出色的數據科學解決方案。因此,當你提出你的解決方案時,溝通是必要的。
團隊合作
不管幸運與否,你將和真正的人一起工作,試圖解決他們真正的問題。你不會一個人在你的部門工作。你不會只和你部門的人一起工作。你將與來自各行各業(yè)的不同人士一起工作,他們擁有不同的技術技能、專業(yè)知識和經驗。要成為一個成功的數據科學家,你必須了解人們,對他們有耐心,靈活,適應不同的情況和方法。
創(chuàng)造一個良好的工作氛圍對公司、你的團隊和你自己都有好處??煽俊⒇撠熑?、樂于幫助同事是我們一直感激的事情。
跨段性
在(不同的)團隊中與人一起工作意味著你將與不同的水平和專業(yè)領域一起工作。這是你學習的機會。這時跨部門性就出現(xiàn)了。
一個在數據科學的嚴格界限之外一無所知的數據科學家不可能是一個偉大的數據科學家??绮块T將使您更快地理解和解決問題。您將更清楚地呈現(xiàn)解決方案。了解商業(yè)、營銷、報告、法律或你所工作的行業(yè)的任何其他方面,很容易讓你成為一個非常理想的雇主。能夠在技術部門和非技術部門之間架起橋梁的專家是罕見的,非常有價值的花朵。
數據科學是當今就業(yè)市場上最熱門的領域之一。對數據科學家的需求很高,但競爭也很激烈。
這意味著成為一名數據科學家并不容易。不過,這也不是不可能。這本指南是一個東西,應該使它更容易決定數據科學是否適合你??偠灾?,以下是在數據科學領域獲得一份工作并取得成功的步驟:
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數據分析師報考條件詳解與準備指南? ? 在數據驅動決策的時代浪潮下,CDA 數據分析師認證愈發(fā)受到矚目,成為眾多有志投身數 ...
2025-07-11數據透視表中兩列相乘合計的實用指南? 在數據分析的日常工作中,數據透視表憑借其強大的數據匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數據分析師:連接數據與業(yè)務的價值轉化者? ? 在大數據與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數據查詢到趨勢預判? ? 在數據驅動決策的時代,預測分析作為挖掘數據潛在價值的核心手段,正被廣泛 ...
2025-07-10數據查詢結束后:分析師的收尾工作與價值深化? ? 在數據分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數 ...
2025-07-10CDA 數據分析師考試:從報考到取證的全攻略? 在數字經濟蓬勃發(fā)展的今天,數據分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數據背后的時間軌跡? 在數據分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數據類型:時間維度的精準切片? ? 在數據的世界里,時間是最不可或缺的維度之一,而year_month數據類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數據分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數據分析師認證考試中,Python 作為數據處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數據趨勢與突變分析的有力工具? ? ? 在數據分析的廣袤領域中,準確捕捉數據的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數據分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數據分析師認證作為國內權威的數據分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網絡(LSTM)作為循環(huán)神經網絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調研數據中的深度應用? 市場調研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調研數 ...
2025-07-07CDA數據分析師證書考試全攻略? 在數字化浪潮席卷全球的當下,數據已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數據分析師也因此成為 ...
2025-07-07剖析 CDA 數據分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數據分析師考試作為衡量數據專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數據處理的關鍵技能? 在數據處理與分析工作中,數據格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數據分析師視角:從數據迷霧中探尋商業(yè)真相? 在數字化浪潮席卷全球的今天,數據已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數據分析師:開啟數據職業(yè)發(fā)展新征程? ? 在數據成為核心生產要素的今天,數據分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03