
數(shù)據(jù)科學(xué)家將成為2015年最熱門的職業(yè)
1月3日,你擅長數(shù)學(xué),會用Python編程,而且還對某個行業(yè)了如指掌?
如果你擁有這樣的技能集,那你就有可能當(dāng)上數(shù)據(jù)科學(xué)家。而如果你當(dāng)上了數(shù)據(jù)科學(xué)家,那你的日子就可以過得風(fēng)風(fēng)光光了――LinkedIn的最新投票結(jié)果顯示,“統(tǒng)計分析和數(shù)據(jù)挖掘” 是2014年最大的求職法寶。
美國招聘網(wǎng)站Glassdoor的報告稱,數(shù)據(jù)科學(xué)家的平均年薪為118709美元(約合人民幣737550元),而程序員的平均年薪為64537美元(約合人民幣400974元)。麥肯錫公司的一份研究預(yù)測稱,到2018年,在“具有深入分析能力的人才”方面,美國可能面臨著14萬到19萬的缺口,而“可以利用大數(shù)據(jù)分析來做出有效決策的經(jīng)理和分析師” 缺口則會達(dá)到150萬。
該領(lǐng)域目前異?;鸨~約大學(xué)數(shù)據(jù)科學(xué)中心課程的負(fù)責(zé)人羅伊-洛倫斯(Roy Lowrance)表示,現(xiàn)在可能已經(jīng)到了巔峰期?!耙苍S存在著泡沫,” 他說。 “無論什么事情,一旦變得這樣火爆,之后就肯定就會冷下來?!辈贿^,紐約大學(xué)希望在未來幾年里擴(kuò)大數(shù)據(jù)科學(xué)課程的招生規(guī)模,把學(xué)生人數(shù)從40名增加到60名。本學(xué)年還有五個月才會結(jié)束,但50%到75%的學(xué)生已經(jīng)找到了比較理想的工作。
為什么該領(lǐng)域會變得如此火爆?琳達(dá)-博奇(Linda Burtch)是芝加哥的獵頭公司博奇工程的董事總經(jīng)理,她表示,盡管像谷歌(微博)、亞馬遜、Netflix和Uber這樣的高科技公司都有自己的數(shù)據(jù)科學(xué)團(tuán)隊,但那些非高科技公司,比如Neiman Marcus、沃爾瑪、Clorox和Gap,它們現(xiàn)在也需要使用這方面的人才,“很多公司都在物色數(shù)據(jù)科學(xué)家,”她說。
這些公司希望,數(shù)據(jù)科學(xué)專業(yè)人才可以挖掘新的信息,來幫助公司開源節(jié)流。IBM負(fù)責(zé)大數(shù)據(jù)業(yè)務(wù)的副總裁Anjul Bhambhri表示,航空航天制造商Pratt & Whitney現(xiàn)在可以預(yù)測出飛機(jī)發(fā)動機(jī)何時需要進(jìn)行維護(hù),準(zhǔn)確率達(dá)到97%,這可以幫助它更加有效地開展業(yè)務(wù)。
雖然IBM在本月剛剛推出了基于云計算的Watson Analytics免費(fèi)增值工具,但是,為了分析非結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)科學(xué)家常常不得不親自動手編寫專門的軟件程序,這正是數(shù)據(jù)科學(xué)家必須掌握編程技巧的一個原因。
學(xué)校教育
洛倫斯說,數(shù)據(jù)科學(xué)家需要具備三項基本技能:數(shù)學(xué)/統(tǒng)計、計算機(jī)能力、在特定業(yè)務(wù)領(lǐng)域的知識。紐約大學(xué)數(shù)據(jù)科學(xué)中心希望招收至少具備其中一種技能的學(xué)生,然后培養(yǎng)他們掌握其他技能,讓學(xué)生到畢業(yè)的時候,可以獨(dú)當(dāng)一面負(fù)責(zé)處理數(shù)據(jù)工作。 “在學(xué)習(xí)過程中,他們要做一些數(shù)據(jù)科學(xué)項目,這些項目需要他們用到這三種技能,”他說。
但是,如果你想成為一名數(shù)據(jù)科學(xué),也不一定非得去大學(xué)讀書才行。從今年9月開始,一家名為梅蒂斯(Metis)的公司開始在紐約舉辦為期十二周的數(shù)據(jù)科學(xué)訓(xùn)練營,費(fèi)用為1.4萬美元。報名的人非常之多,入學(xué)競爭相當(dāng)激烈。梅蒂斯公司的聯(lián)合創(chuàng)始人杰森-莫斯(Jason Moss)說,大約有一半的學(xué)生都擁有碩士或博士學(xué)位。
第一期訓(xùn)練營在12月初結(jié)束。莫斯說,不過幾周, 15名學(xué)生中就有6名拿到了聘用通知。
“我不認(rèn)為訓(xùn)練營可以替代大學(xué)教育,”莫斯說?!坝?xùn)練營可以提供一條捷徑,讓你以最快的速度找到一份工作,但大學(xué)的目的不在于此。但我也不認(rèn)為你必須上大學(xué)才能成為一名數(shù)據(jù)科學(xué)家,”他說?!坝幸环N人,他們天生具有好奇心,有勇氣,有決心,總想把事情理出頭緒,他們在這一行可以干得很好?!?/span>
Anmol Rajpurohit是一名獨(dú)立的數(shù)據(jù)科學(xué)家兼顧問,他說,做這一行工作最重要的素質(zhì)就是能夠快速學(xué)習(xí)東西。“與專長于任何特定編程語言相比,泛型編程技巧遠(yuǎn)遠(yuǎn)更加重要,”他說。 “在如今這個時代,技術(shù)的發(fā)展突飛猛進(jìn),語言會很快過時,新的語言則將迅速普及。因此,學(xué)東西很快的人,會比單獨(dú)領(lǐng)域的專家更有前途?!?/span>
洛倫斯說,他認(rèn)為,在某些技能方面,訓(xùn)練營和網(wǎng)上課程可以為學(xué)習(xí)者提供很大的幫助。但在另外一些方面,它們的作用就就相對有限了。紐約大學(xué)的數(shù)據(jù)科學(xué)課程有一個優(yōu)勢,就是可以按照正確的先后順序來培養(yǎng)你的技能。“我們的教學(xué)順序可以讓你循序漸進(jìn)、融會貫通地掌握技能。”他說。
數(shù)據(jù)科學(xué)家要做哪些事?
游戲公司Playstudios的數(shù)據(jù)科學(xué)家喬恩-格林伯格(Jon Greenberg)說:“在日常工作中,我需要管理一系列控制面板,它們提供的信息可以讓公司知道,我們的生意到底做得怎么樣? 用戶在做什么事情?”格林伯格現(xiàn)在是一名經(jīng)理了,所以他編程的時候沒有以往那么多,但是他有時候仍然需要編程。通常來說,他把數(shù)據(jù)從Apache Hadoop的存儲器里調(diào)取出來,在分析平臺Revolution R上運(yùn)行它,并對它進(jìn)行一些可視化處理。 “比如說,我們可以從中得知一部分用戶如何與新推出的功能互動,”他解釋說。
六年前,格林伯格拿到了統(tǒng)計學(xué)的碩士學(xué)位。他希望進(jìn)入政府部門工作,但卻驚訝地發(fā)現(xiàn),公司企業(yè)非常需要數(shù)據(jù)科學(xué)家。 “那個時候,數(shù)據(jù)科學(xué)領(lǐng)域還沒有現(xiàn)在這么火爆,,”他說?,F(xiàn)在,他每天都能從獵頭那里收到一個電話或一封郵件。 “這種情況不只是發(fā)生在我身上,”他說?!八械臄?shù)據(jù)科學(xué)家可能都是這樣?!?/span>
對于格林伯格來說,就業(yè)機(jī)會很好只是一個加分項,因為他本來就熱愛這一行。 “我認(rèn)為,要做數(shù)據(jù)科學(xué)工作,你必須得有分析頭腦才行,而且還得有好奇心,”他說。“你必須得有靈活性和創(chuàng)造性,構(gòu)思出不同的方法來解決問題?!边@項工作的唯一缺點,格林伯格說,就是“清潔”數(shù)據(jù)(去掉那些沒有相關(guān)性的結(jié)果)需要花費(fèi)大量時間?!斑@部分任務(wù)并不是那么招人喜歡,你得花很多時間來做它?!彼f。
Rajpurohit說,他花了很多精力來清潔數(shù)據(jù)和做研究。 “我很大一部分時間都花在做研究上,因為我經(jīng)常會遇到全新的問題,因此,我需要研究特定領(lǐng)域最新文獻(xiàn),或者是找找專家,聽聽他們在這方面的看法,”他說。
“盡管數(shù)據(jù)科學(xué)這個名字和藝術(shù)毫不沾邊,但是你需要把藝術(shù)和科學(xué)很好地結(jié)合起來??茖W(xué)的部分很明顯――數(shù)學(xué),程序設(shè)計等等。但藝術(shù)部分是同樣重要――創(chuàng)造力,對語境有著深刻的理解。把這兩部分結(jié)合在一起,你就會變得善于解決問題?!?/span>
盡管如此,Rajpurohit也承認(rèn),數(shù)據(jù)科學(xué)并不像眼下很多人以為的那樣善良迷人。這個領(lǐng)域確實是在變得越來越重要,而且也出現(xiàn)了很多高薪機(jī)會,但在數(shù)據(jù)科學(xué)家需要做的日常工作中,有很多其實都很枯燥。
你是當(dāng)數(shù)據(jù)科學(xué)家的料嗎?
每天花大量時間來編程,分析控制面板上的數(shù)據(jù),獲得相關(guān)信息,如果你對這樣的工作感興趣,那么你可能就適合干這一行。但如果你僅僅是想拿高工資,那么你可能就會覺得這樣的日子過起來苦不堪言。你要知道:真正適合干這一行的人,常常會在業(yè)余時間里編寫程序,分析數(shù)據(jù),而他們這樣做只是為了自娛自樂。
亞當(dāng)-弗洛葛爾(Adam Flugel)是博奇公司的數(shù)據(jù)科學(xué)招聘獵頭,他談到了最近遇到的一名候選人。此人擁有博士學(xué)位,今年秋天將去電藝公司(Electronic Arts)工作?!罢嬲屗摲f而出的是優(yōu)勢是,他在空閑時間也做這種事情,而且純粹就是為了好玩,”弗洛葛爾說?!八嵌嗳嗽诰€游戲世界《坦克世界大戰(zhàn)》的玩家,領(lǐng)導(dǎo)著一個玩家團(tuán)隊。于是他編寫了一個從游戲服務(wù)器抓取數(shù)據(jù)的程序,然后進(jìn)行數(shù)據(jù)分析,評估自己團(tuán)隊的表現(xiàn)。然后他利用這些信息來弄清應(yīng)該如何調(diào)整自己的戰(zhàn)略,應(yīng)該招收哪些類型的成員,才能提升團(tuán)隊的整體表現(xiàn)?!?/span>
所以,如果你愛的并不是數(shù)據(jù)本身,而是它可以給你帶來的高薪,那么你會發(fā)現(xiàn),自己很難與那樣的人競爭。但是博奇說,每個人都應(yīng)該學(xué)會熱愛數(shù)據(jù),即便只是為了自己事業(yè)前途著想,也該這樣做。 “十年之內(nèi),如果你不是數(shù)據(jù)大咖,你就別想升到‘首席XX官’的位置上”博奇說。
但是像史蒂夫-喬布斯、比爾-蓋茨那樣的情況又怎么解釋呢?他們擁有遠(yuǎn)見卓識,并沒有陷入數(shù)據(jù)科學(xué)的細(xì)枝末節(jié)之中。“那是30年前的事了,”博奇說。 “我說的是未來10年?!?/span>
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10