
作者 | Jeremie Harris
翻譯 | Mika
CDA 數(shù)據(jù)分析師原創(chuàng)作品,轉(zhuǎn)載需授權(quán)
首先我要說的是,我是一名博士肄業(yè)生。
這個(gè)頭銜給我?guī)砹怂^的光環(huán),它暗示我在研究生院待過,做過一些學(xué)術(shù)研究。完成博士學(xué)位,意味著你不過是千萬個(gè)”書呆子”中的一員,而在學(xué)了幾年后輟學(xué)似乎顯得你更有個(gè)性。人們期待知道你之后會(huì)做些什么。他們可能會(huì)說,“特斯拉的CEO Elon Musk就選擇放棄研究生學(xué)位,離開學(xué)校去創(chuàng)業(yè),你也可能成為下一個(gè)Elon!”
那么如果想入行數(shù)據(jù)科學(xué),學(xué)歷重要嗎?一定需要博士學(xué)歷或研究生學(xué)歷嗎?在本文中我將分享我的看法。
我在數(shù)據(jù)科學(xué)導(dǎo)師制創(chuàng)業(yè)公司工作。在工作中,我已經(jīng)面試過數(shù)千位有抱負(fù)的數(shù)據(jù)科學(xué)家,當(dāng)中有些人有博士學(xué)位,有些有碩士學(xué)位,有些是本科生,也有各個(gè)階段的肄業(yè)生。這也讓我對(duì)數(shù)據(jù)科學(xué)職業(yè)有了更深的認(rèn)識(shí)。
STEM:科學(xué)(Science),技術(shù)(Technology),工程(Engineering),數(shù)學(xué)(Mathematics)這四門學(xué)科
有許多人會(huì)向他人咨詢,是否要繼續(xù)深造讀研或讀博,而當(dāng)中很多人對(duì)前景沒有全面的分析。
其實(shí)不是所有的學(xué)位都適合每個(gè)人,原因如下。
一、博士學(xué)位
(這可能會(huì)讓許多有博士學(xué)位的人感到不舒服,在此我提前道歉。)
“我看到許多數(shù)據(jù)科學(xué)工作都需要博士學(xué)位。我是否要有博士學(xué)位才能成為數(shù)據(jù)科學(xué)家呢?“
不,并不需要。
不要誤會(huì)我的意思,博士頭銜的確會(huì)給你帶來明顯的優(yōu)勢(shì)。但也要考慮一些現(xiàn)實(shí)因素。
如果你的目標(biāo)是成為數(shù)據(jù)科學(xué)家或機(jī)器學(xué)習(xí)工程師/研究員,那么有博士學(xué)位會(huì)給你加分不少。但與此同時(shí)也要考慮以下兩點(diǎn):
1.獲得博士學(xué)位需要非常長(zhǎng)的時(shí)間。
2.除非你跟著合適的導(dǎo)師,攻讀合適的學(xué)位,否則你可能學(xué)不到任何有價(jià)值的東西。
針對(duì)第1點(diǎn),在美國(guó)或加拿大,獲得博士學(xué)位需要4年到8年才能完成。平均需要5到6年,具體取決于學(xué)?!,F(xiàn)在讓我們把它放到透視中。
在數(shù)據(jù)科學(xué)領(lǐng)域瞬息萬變,5年內(nèi)各種成果層出不窮。要知道,在5年前Spark、XGBoost、jupyter notebook、GloVe、spaCy、TensorFlow、Keras、Pytorch、InceptionNet、ResNet、強(qiáng)化學(xué)習(xí)等等都還不存在。
因此,除非你打算當(dāng)新技術(shù)出現(xiàn)時(shí),花時(shí)間自己鉆研。否則你會(huì)發(fā)現(xiàn)學(xué)習(xí)期間接觸到的技術(shù)遠(yuǎn)遠(yuǎn)跟不上當(dāng)下的發(fā)展。這意味著即使你畢業(yè)后,還需要自己學(xué)習(xí)這些技術(shù)。
關(guān)鍵在于,數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的發(fā)展非???,在未來只會(huì)發(fā)展得更快。因此,當(dāng)考慮攻讀數(shù)據(jù)科學(xué)或機(jī)器學(xué)習(xí)相關(guān)領(lǐng)域的博士學(xué)位時(shí),你實(shí)際上是把賭注都下在你所要學(xué)習(xí)的領(lǐng)域。你希望在畢業(yè)時(shí),該領(lǐng)域還是炙手可熱的。而這樣的賭注很冒險(xiǎn),而且賭注很高。
第2點(diǎn),思考一下你的導(dǎo)師是誰,為什么他們沒有在Google或Facebook工作。
當(dāng)然,有些人更喜歡學(xué)術(shù)研究,而不是在行業(yè)中運(yùn)用數(shù)據(jù)科學(xué)或機(jī)器學(xué)習(xí)。但值得記住的是,行業(yè)頂級(jí)的機(jī)器學(xué)習(xí)人才的薪資是非常豐厚的,因此學(xué)術(shù)界的可能會(huì)稍遜一籌。
當(dāng)然,有些地方也有些例外。這主要指的是加拿大的Vector Institute或MILA;麻省理工學(xué)院和美國(guó)伯克利的數(shù)據(jù)科學(xué)課程等頂級(jí)精英項(xiàng)目。
總結(jié)一下:如果你只想成為Airbnb的深度學(xué)習(xí)工程師,那么博士學(xué)位一定程度上能成為你的敲門磚。但是,如果你不是在頂級(jí)項(xiàng)目中攻讀博士學(xué)位,那么不要期望被行業(yè)頂尖的公司錄用。
但是,如果你想找份普通的數(shù)據(jù)科學(xué)工作,獲得博士學(xué)位可能并不是正確的舉措。你可以用4到8年的時(shí)間獲得豐富的工作經(jīng)驗(yàn),去成長(zhǎng)為一名真正的數(shù)據(jù)科學(xué)家,那么出現(xiàn)新技術(shù)時(shí),你能更好的進(jìn)行預(yù)測(cè),保持領(lǐng)先的位置。
如果你考慮攻讀與數(shù)據(jù)科學(xué)無關(guān)領(lǐng)域的博士學(xué)位(例如物理,生物學(xué),化學(xué)),并且目標(biāo)是找數(shù)據(jù)科學(xué)方面的工作,那么這條建議可能有些刺耳:如果你離畢業(yè)還有18個(gè)月或更長(zhǎng)時(shí)間,而且你確定自己想成為一名數(shù)據(jù)科學(xué)家,那么可以考慮輟學(xué)。考慮到沉沒成本,你應(yīng)該對(duì)之前決策感到質(zhì)疑,根據(jù)我之前的經(jīng)驗(yàn)來看放棄可能是正確的選擇。
二、碩士學(xué)位
入行數(shù)據(jù)科學(xué)需要碩士學(xué)位嗎?
視情況而定。以下是我列出的記分表,如果根據(jù)你的情況,分?jǐn)?shù)大于6,那么答案是“碩士學(xué)位可能會(huì)有所幫助”。
你有非常相關(guān)的STEM背景(物理、數(shù)學(xué)、計(jì)算機(jī)科學(xué)等本科學(xué)歷):0分
你有較為相關(guān)的STEM背景(生物學(xué)、生物化學(xué)、經(jīng)濟(jì)學(xué)等本科學(xué)歷):2分
你沒有相關(guān)的STEM背景:5分
你有不到1年的Python使用經(jīng)驗(yàn):3分
你沒有編程相關(guān)的工作經(jīng)驗(yàn):3分
你不認(rèn)為自己擅長(zhǎng)獨(dú)立學(xué)習(xí):4分
當(dāng)我說這個(gè)記分表實(shí)際是一個(gè)邏輯回歸算法時(shí),你不明白我的意思:1分
注意:
需要考慮的是,你是否需要數(shù)據(jù)科學(xué)碩士學(xué)位或數(shù)據(jù)科學(xué)訓(xùn)練營(yíng)。如果選擇參加訓(xùn)練營(yíng),要注意他們的激勵(lì)措施:是否課程完成后保證聘用?是否有與訓(xùn)練營(yíng)相關(guān)的求職指導(dǎo)服務(wù)?
許多人都對(duì)訓(xùn)練營(yíng)持懷疑態(tài)度,這是有道理的。但大多數(shù)忽略的是,他們對(duì)待大學(xué)所提供的相關(guān)碩士學(xué)位也該如此。鞏固碩士學(xué)位就相當(dāng)于訓(xùn)練營(yíng)。如果你不在乎你的成績(jī),那么要注重你從中學(xué)到了什么。在選擇相應(yīng)的碩士學(xué)位和課程項(xiàng)目時(shí)要詢問其研究生就業(yè)率。有的大學(xué)希望學(xué)生選一個(gè)簡(jiǎn)單的專業(yè),而不是好的專業(yè),這是一場(chǎng)心理博弈。你的目標(biāo)是最終被聘用,找到理想的工作,而不是僅僅為了一紙文憑而付出時(shí)間和精力。
即使完成了碩士學(xué)位,你還需要學(xué)習(xí)很多技能,可能比你預(yù)想的還要多。但只要碩士課程的時(shí)間較短(最好不超過2年),成本不是太高。
三、本科學(xué)位
總的來說,是的,成為數(shù)據(jù)科學(xué)家你需要相關(guān)本科學(xué)位。不僅僅是因?yàn)槟阈枰莆障嚓P(guān)知識(shí),而且公司并不認(rèn)為你通過自學(xué),參加訓(xùn)練營(yíng)和一些在線課程就能勝任數(shù)據(jù)科學(xué)的工作 。
但關(guān)于本科學(xué)位你要注意的是,如果你和科技行業(yè)的人聊聊,你很快會(huì)發(fā)現(xiàn)科技型工作中涉及到的內(nèi)容要遠(yuǎn)遠(yuǎn)超出學(xué)校課本。這是因?yàn)閷W(xué)校所教的本科課程一般比現(xiàn)實(shí)情況要滯后5到10年。如果你學(xué)的是不會(huì)發(fā)生很大變化的專業(yè)是沒有太大問題的,比如如物理、數(shù)學(xué)或統(tǒng)計(jì)數(shù)據(jù)等。
但是如果你是工程或計(jì)算機(jī)科學(xué)專業(yè),并且你在一家出色的公司實(shí)習(xí),你想休學(xué)或肄業(yè)來獲得更多的工作經(jīng)驗(yàn),那么你可以考慮這樣做。如果你讀本科的目的是為了獲得一份工作,你已經(jīng)在一家有不錯(cuò)前景的公司獲得職位,那么何必多付幾年學(xué)費(fèi)呢。
我的意思并不是你應(yīng)該不讀完本科就去工作,我想說的是,如果你完成了實(shí)習(xí)并且獲得了相應(yīng)的全職工作,那么對(duì)于是否完成學(xué)業(yè)應(yīng)該有更開放的觀念。而不是因?yàn)榇蠹叶歼@么做,才做出這種選擇。
結(jié)語
在本文中,我給出的一些建議可能不是那么常規(guī)。但在數(shù)據(jù)科學(xué)這樣快速發(fā)展的領(lǐng)域,慣例往往并不是最優(yōu)選擇。當(dāng)今社會(huì)中,人們對(duì)傳統(tǒng)教育價(jià)值的看法應(yīng)該與時(shí)俱進(jìn)。
當(dāng)然,這并不意味著正規(guī)教育以及研究生學(xué)位是不值得的。但是,不應(yīng)該認(rèn)為獲得碩士或博士學(xué)位是必備的。如果你讀研讀博只是為了符合數(shù)據(jù)科學(xué)職業(yè)軌跡的刻板印象,那么你可能需要重新考慮了。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10