
作者Ian Xiao,德勤營銷與人工智能實(shí)踐.
大約在這座城市因新冠肺炎而被封鎖的3周前,我和一個(gè)朋友坐在多倫多市中心我們最喜歡的泰國餐館里。
“我應(yīng)該留在數(shù)據(jù)科學(xué)嗎?如果沒有,我下一步該怎么辦?“我的朋友問。
就像采集的聲音和餐廳新鮮食物的氣味一樣,如何進(jìn)入數(shù)據(jù)科學(xué)的問題現(xiàn)在似乎有點(diǎn)遙遠(yuǎn)。事實(shí)上,你可以在Google上找到大約30億個(gè)結(jié)果,其中有一個(gè)非常具體的步驟指南(只有大約20億個(gè)關(guān)于“如何賺錢”的結(jié)果)。
然而,我朋友的問題揮之不去。在內(nèi)心深處,這種緊張關(guān)系是由兩個(gè)因素驅(qū)動(dòng)的:1)數(shù)據(jù)科學(xué)的期望與現(xiàn)實(shí)--它可能比我們預(yù)期的更可怕;2)角色與我們的愿望。
那么,有哪些選擇呢?
要知道我們想去哪里,你必須知道我們?cè)谀睦?。為了更好地了解其他選擇,我們中的許多人可能會(huì)轉(zhuǎn)向“什么是數(shù)據(jù)科學(xué)?”這個(gè)問題,如果你用谷歌搜索這個(gè)短語,我們可能會(huì)遇到這樣的問題:
這種分類是有意義的,但它并沒有真正捕捉到日常工作和公司性質(zhì)的現(xiàn)實(shí)和細(xì)微差別。這兩個(gè)因素在我們做出專業(yè)決策時(shí)可以說是最重要的。
對(duì)此有一個(gè)更好的思考方式。因此,讓我向您展示數(shù)據(jù)科學(xué)家的原型。
在我們開始之前,考慮一下我的背景和旅程是很重要的,這樣你就可以根據(jù)自己的現(xiàn)實(shí)和限制來翻譯我的見解。
簡而言之,,我通過為大型企業(yè)提供咨詢、與許多類型的數(shù)據(jù)科學(xué)家交朋友,以及在最終被收購的AI初創(chuàng)企業(yè)開發(fā)ML產(chǎn)品,見證了數(shù)據(jù)科學(xué)的發(fā)展。
我的觀點(diǎn)只是一個(gè)數(shù)據(jù)點(diǎn)(希望它是有用的和獨(dú)特的),所以你要注意其他人的。
那么,什么是數(shù)據(jù)科學(xué)?它取決于公司的規(guī)模(企業(yè)或初創(chuàng)企業(yè))和角色的主要責(zé)任(面向客戶或?qū)W⒂趦?nèi)部)。
當(dāng)你面試一個(gè)數(shù)據(jù)科學(xué)的角色時(shí),盡管有頭銜和工作描述,很可能屬于以下四個(gè)過于簡化和主觀標(biāo)記的組之一。
如何使用它?原型向您展示了各種可能性。它可以讓你看到你現(xiàn)在在哪里,以及什么是立即的選擇。對(duì)于有抱負(fù)的數(shù)據(jù)科學(xué)家來說,你可以用這個(gè)來計(jì)算你最好的起點(diǎn)。
接下來,您可能會(huì)問:我如何知道新角色是否更適合我?
為了幫助您做出決定,下面是每個(gè)角色的一些優(yōu)點(diǎn)和缺點(diǎn)。此外,我將討論可能最適合的人才簡介。當(dāng)然,這些都有些主觀:對(duì)我有利的事情可能對(duì)你不利??傆欣?。所以做出你自己的判斷。
注意:
在全球咨詢公司或大型技術(shù)公司的專業(yè)服務(wù)部門(如德勤、麥肯錫、埃森哲、谷歌、IBM等)提供數(shù)據(jù)科學(xué)服務(wù)
The good:關(guān)于解決問題和如何高效工作的非常好的培訓(xùn)。做非常“重要的事情”,因?yàn)榭蛻魹榻Y(jié)果支付了很高的費(fèi)用。每個(gè)項(xiàng)目都可以是不同的,以防你感到無聊或沮喪。非常明確的晉升途徑和要求(例如,從分析師、經(jīng)理到合作伙伴)。接觸高級(jí)管理人員,早期職業(yè)生涯中廣泛的話題,以及許多雄心勃勃的人。
壞的:商業(yè)價(jià)值超過一切(例如,科學(xué)創(chuàng)新和酷算法)。所有資歷都要求工作時(shí)間。有些公司可能不會(huì)考慮讓數(shù)據(jù)科學(xué)家進(jìn)入傳統(tǒng)的伙伴關(guān)系軌道(你可能會(huì)覺得自己被邊緣化了,但別擔(dān)心,大多數(shù)人都非常尊重?cái)?shù)據(jù)科學(xué)家)。很多阿爾法人格。
最適合:業(yè)務(wù)導(dǎo)向型的人,受過一定的技術(shù)培訓(xùn),渴望在大公司里經(jīng)營自己的“小企業(yè)”。剛起步的學(xué)生,尋找導(dǎo)師,想學(xué)最好的靈歌,不介意真的很努力。
在專注于人工智能的初創(chuàng)企業(yè)或中型公司(如Dessa、Element AI、H2O、Cloudera、Palantir)擔(dān)任技術(shù)銷售或項(xiàng)目負(fù)責(zé)人。
好的:您可以處理一些前沿的用例,因?yàn)榭蛻敉ǔOMM(jìn)行創(chuàng)新,而不是交付(無聊的)長期、大規(guī)模的轉(zhuǎn)換項(xiàng)目。在重要的戰(zhàn)略和產(chǎn)品決策上有更大的發(fā)言權(quán)。要敏捷,要?jiǎng)?chuàng)新。
不好的:有些客戶可能不信任你的大型項(xiàng)目(例如,獲得更多預(yù)算),這是“靈活和創(chuàng)新”的另一面。為了贏得客戶的信任,可能需要做大量的“免費(fèi)”工作。與大公司相比,后臺(tái)支持更少。產(chǎn)品愿景可能會(huì)受到投資者(如果你找錯(cuò)了風(fēng)投)或沉沒成本心態(tài)的影響,而不是真正的市場需求。
最適合:那些希望在早期與公司一起成長,實(shí)現(xiàn)創(chuàng)業(yè)夢(mèng)想,并且已經(jīng)擁有堅(jiān)實(shí)的業(yè)務(wù)網(wǎng)絡(luò)、領(lǐng)域?qū)iL和/或聲譽(yù)的人。對(duì)新手來說不好,因?yàn)槟阈枰_始跑步。
具有軟件和/或ML背景的人,他們?cè)谌斯ぶ悄墚a(chǎn)品公司從事工程工作,構(gòu)建IP、演示和支持銷售電話。
好的:研究有趣和實(shí)際的問題,而不必處理太多的客戶政治問題。短期項(xiàng)目。以“內(nèi)部用戶”的身份影響或定義產(chǎn)品應(yīng)該如何設(shè)計(jì)。為客戶或內(nèi)部建立酷的東西。
壞的:可能被拉入面向客戶機(jī)或用戶的角色,這會(huì)在競爭優(yōu)先級(jí)和時(shí)間管理方面造成緊張。很難在“尖端”和“立即實(shí)用”之間找到正確的平衡點(diǎn)??赡軙?huì)被卷入沒完沒了的客戶支持工作中。
最適合:以產(chǎn)品為導(dǎo)向,以工程為重點(diǎn),但有時(shí)很笨拙的人。在某些技術(shù)堆?;蚬ぷ髁鞒谭矫婢哂蓄I(lǐng)域?qū)iL的經(jīng)驗(yàn)豐富的專業(yè)人員。學(xué)生有一個(gè)開放和好奇的頭腦,喜歡技術(shù)挑戰(zhàn),并能完成。
好吧,家庭可能很復(fù)雜,所以這個(gè)群體需要分成兩部分:無名英雄和超級(jí)極客。
4.1-無名英雄
來自企業(yè)內(nèi)部傳統(tǒng)BI、分析和建模組的人員。他們主要從事業(yè)務(wù)或職能(例如,營銷、風(fēng)險(xiǎn)、財(cái)務(wù)等)。在這個(gè)術(shù)語被創(chuàng)造出來之前,他們是數(shù)據(jù)科學(xué)家。
好的:非常專注的工作。接近真實(shí)的商業(yè)運(yùn)作。具有訪問唯一數(shù)據(jù)集的權(quán)限。有機(jī)會(huì)使用可運(yùn)作的大型基礎(chǔ)設(shè)施。很好的工作和生活平衡。有做出投資決定的影響力或權(quán)力。
不好的:事情在(大多數(shù))時(shí)候都是緩慢和無聊的。經(jīng)常得不到21世紀(jì)最性感工作的認(rèn)可。內(nèi)部政治。緩慢的(呃)事業(yè)軌跡。被鎖定在某些角色或項(xiàng)目中。
最適合:在生活中找到自己的激情或喜歡在特定領(lǐng)域投入時(shí)間的人。不在乎炒作的人。有耐心和韌性的人。
4.2-超級(jí)極客
數(shù)據(jù)科學(xué)界“金童”的刻板印象。在主要公司從事研發(fā)工作的人,如谷歌大腦/DeepMind、Facebook's Fail、Uber和沃爾瑪Research等。
好的:研究非常智力的主題。訪問唯一的數(shù)據(jù)集和問題。能夠用大公司的資源突破極限。得到很多認(rèn)可和贊揚(yáng)。
不好的:必須展示“業(yè)務(wù)價(jià)值”的強(qiáng)烈壓力。業(yè)務(wù)優(yōu)先級(jí)會(huì)限制或影響研究主題。如果研究證明有價(jià)值,可能會(huì)被吸進(jìn)“無聊”的實(shí)施中。
最適合:學(xué)術(shù)。對(duì)學(xué)術(shù)研究和教育背景有很強(qiáng)品味的工程師。希望發(fā)表文章并獲得一些行業(yè)曝光率的研究生。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10CDA 數(shù)據(jù)分析師:商業(yè)數(shù)據(jù)分析實(shí)踐的落地者與價(jià)值創(chuàng)造者 商業(yè)數(shù)據(jù)分析的價(jià)值,最終要在 “實(shí)踐” 中體現(xiàn) —— 脫離業(yè)務(wù)場景的分 ...
2025-09-10機(jī)器學(xué)習(xí)解決實(shí)際問題的核心關(guān)鍵:從業(yè)務(wù)到落地的全流程解析 在人工智能技術(shù)落地的浪潮中,機(jī)器學(xué)習(xí)作為核心工具,已廣泛應(yīng)用于 ...
2025-09-09SPSS 編碼狀態(tài)區(qū)域中 Unicode 的功能與價(jià)值解析 在 SPSS(Statistical Product and Service Solutions,統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案 ...
2025-09-09