
認(rèn)為你的公司需要數(shù)據(jù)科學(xué)家?你可能錯(cuò)了
當(dāng)我在15年前開(kāi)始從事數(shù)據(jù)工作時(shí),我從未想過(guò)近年來(lái)數(shù)據(jù)科學(xué)家會(huì)如此備受追捧。如今,數(shù)據(jù)科學(xué)家被認(rèn)為是全球最熱門(mén)的職位之一,市場(chǎng)上對(duì)數(shù)據(jù)科學(xué)家的需求供不應(yīng)求。
創(chuàng)業(yè)公司在產(chǎn)品生命周期的早期招聘數(shù)據(jù)科學(xué)家的情況并不罕見(jiàn)。其實(shí)很多情況下,他們并不需要數(shù)據(jù)科學(xué)家。
作為一名數(shù)據(jù)科學(xué)方面的倡導(dǎo)者,為什么我會(huì)這么認(rèn)為呢?
首先,我想聲明的是雇用數(shù)據(jù)科學(xué)家確實(shí)有很多好處。如果使用得當(dāng),數(shù)據(jù)科學(xué)家將成為強(qiáng)大的商業(yè)武器。我想強(qiáng)調(diào)的是,數(shù)據(jù)科學(xué)當(dāng)中涉及到大量的數(shù)據(jù)相關(guān)操作和技巧,這不是在短期培訓(xùn)中就能掌握的。
因此,當(dāng)企業(yè)需要聘請(qǐng)數(shù)據(jù)科學(xué)家時(shí),需要慎重考慮應(yīng)該何時(shí)聘請(qǐng)哪種數(shù)據(jù)科學(xué)家。
當(dāng)企業(yè)打算聘請(qǐng)數(shù)據(jù)科學(xué)家之前,可以先試著問(wèn)自己以下四個(gè)問(wèn)題:
1. 有多少數(shù)據(jù)?
如果你是一家尚未啟動(dòng)的創(chuàng)業(yè)公司,那么你們可能并不需要全職數(shù)據(jù)科學(xué)家。其實(shí),如果你的公司已經(jīng)發(fā)展的較為成熟,但只有小規(guī)模的客戶(hù)、產(chǎn)品或會(huì)員基礎(chǔ),那么你也不需要數(shù)據(jù)科學(xué)家。
為什么呢?顯然數(shù)據(jù)科學(xué)家需要數(shù)據(jù)。不是任何數(shù)據(jù)都可以。許多技術(shù)需要至少數(shù)萬(wàn)個(gè)、甚至數(shù)百萬(wàn)個(gè)數(shù)據(jù)點(diǎn)才能構(gòu)建。
如今,深度學(xué)習(xí)備受關(guān)注。在針對(duì)數(shù)據(jù)科學(xué)家的工作描述中充滿(mǎn)了神經(jīng)網(wǎng)絡(luò)、計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理等術(shù)語(yǔ)。而這類(lèi)技術(shù)依賴(lài)于大量的訓(xùn)練數(shù)據(jù)。谷歌翻譯就是建立在超過(guò)1.5億個(gè)詞匯基礎(chǔ)上的神經(jīng)網(wǎng)絡(luò)。成功部署這型模型所需的數(shù)據(jù)量超過(guò)了許多公司加起來(lái)的數(shù)據(jù)總量。
很多技術(shù)比深度學(xué)習(xí)使用更少的數(shù)據(jù),但是當(dāng)中仍然需要相當(dāng)大的樣本,還需要能夠判斷何時(shí)使用哪種方法的知識(shí)儲(chǔ)備。目前需要大量的投入才能創(chuàng)建數(shù)據(jù)科學(xué)所需要的環(huán)境,擁有資金和昂貴的資源是遠(yuǎn)遠(yuǎn)不夠的。
2. 是否有已制定的關(guān)鍵績(jī)效指標(biāo)(KPI)和商業(yè)智能報(bào)表?
如果沒(méi)有對(duì)企業(yè)驅(qū)動(dòng)因素的基本了解,那么將難以利用先進(jìn)技術(shù)。
數(shù)據(jù)科學(xué)家能夠通過(guò)機(jī)器學(xué)習(xí)進(jìn)行預(yù)測(cè),例如哪些用戶(hù)會(huì)流失、哪些用戶(hù)很活躍。但是如果缺乏對(duì)流失和高度活躍的定義,那么在構(gòu)建預(yù)測(cè)模型之前會(huì)遇到問(wèn)題。
此外,如果沒(méi)有足夠的指標(biāo)進(jìn)行評(píng)估,那么將很難驗(yàn)證模型。A/B測(cè)試等其他技術(shù)需要總體評(píng)估標(biāo)準(zhǔn)(OEC),這通常是業(yè)務(wù)驅(qū)動(dòng)的KPI。
3. 數(shù)據(jù)科學(xué)家要做什么?
這是四個(gè)問(wèn)題中最主觀(guān)和最有趣的問(wèn)題,“你想讓數(shù)據(jù)科學(xué)家做什么?”我得到的最常見(jiàn)的答案是:“我們不知道,這也是為什么我們需要雇用一位。”
在這種情況下,我會(huì)告訴該企業(yè)這是行不通的。雖然聘請(qǐng)數(shù)據(jù)科學(xué)家時(shí),你并不需要成為該方面的專(zhuān)家,但是你應(yīng)該清楚哪些是可行的、哪些是不可行的,從而不會(huì)設(shè)定不切實(shí)際的期望。
數(shù)據(jù)科學(xué)不是魔術(shù),但也不是傳統(tǒng)科學(xué)。數(shù)據(jù)科學(xué)是一門(mén)藝術(shù),也是一門(mén)科學(xué),這意味著當(dāng)中技術(shù)和能力的可變性很大。企業(yè)可以考慮讓現(xiàn)有團(tuán)隊(duì)的成員發(fā)展成數(shù)據(jù)科學(xué)家。對(duì)現(xiàn)有分析師來(lái)說(shuō),進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域的方式之一是對(duì)現(xiàn)有的KPI進(jìn)行預(yù)測(cè)。一方面,他們有機(jī)會(huì)學(xué)習(xí)熟悉的數(shù)據(jù); 另一方面,對(duì)現(xiàn)有員工進(jìn)行投資意味著將來(lái)市場(chǎng)招聘的需求減少。
4. 數(shù)據(jù)科學(xué)家有哪些內(nèi)部支持?
如果數(shù)據(jù)科學(xué)家在你的企業(yè)沒(méi)有適當(dāng)?shù)闹С?,那么?qǐng)不要為招募他們而投資。近年來(lái),數(shù)據(jù)科學(xué)課程數(shù)量激增,然而許多畢業(yè)生并沒(méi)有準(zhǔn)備好解決業(yè)務(wù)問(wèn)題。絕大多數(shù)課程都讓學(xué)生解決預(yù)先清潔好的數(shù)據(jù)。在現(xiàn)實(shí)世界中,干凈的數(shù)據(jù)并不存在。
在沒(méi)有高級(jí)數(shù)據(jù)科學(xué)家指導(dǎo)的前提下,聘請(qǐng)初級(jí)數(shù)據(jù)科學(xué)家并不明智,初級(jí)數(shù)據(jù)科學(xué)家會(huì)遇到難題,而且往往會(huì)導(dǎo)致錯(cuò)誤的分析。初級(jí)的數(shù)據(jù)科學(xué)家團(tuán)隊(duì)難以將業(yè)務(wù)問(wèn)題轉(zhuǎn)化為技術(shù)問(wèn)題,而錯(cuò)誤的分析會(huì)導(dǎo)致任務(wù)難以完成。
聘請(qǐng)高級(jí)數(shù)據(jù)科學(xué)家并不能完全緩解這個(gè)問(wèn)題,部分原因在于很難證明雇傭人員的水平和資歷。如果你很幸運(yùn)地聘請(qǐng)到優(yōu)秀的人員,他仍然需要來(lái)自領(lǐng)導(dǎo)團(tuán)隊(duì)的大量支持。比如,創(chuàng)建從未使用過(guò)的模型;或者進(jìn)行A/B測(cè)試但結(jié)果被忽略。更糟的是,分析問(wèn)題所需的數(shù)據(jù)并沒(méi)有被收集。
通常,必要的第一步是強(qiáng)大的數(shù)據(jù)收集程序,這需要由工程師或數(shù)據(jù)庫(kù)管理員提供,而不是數(shù)據(jù)科學(xué)家。在很多企業(yè)中,高級(jí)數(shù)據(jù)科學(xué)家需要花大量時(shí)間完成數(shù)據(jù)需求和團(tuán)隊(duì)部署,而這很容易導(dǎo)致高級(jí)數(shù)據(jù)科學(xué)家的流失。
結(jié)語(yǔ)
招聘和留住優(yōu)秀的數(shù)據(jù)科學(xué)家的成本是很昂貴的。但如果能明確何時(shí)聘用、如何聘用、聘用哪種人才,則能夠有效地減少成本。
不要陷入招聘廣告的陷阱,那些只是對(duì)工作技能的簡(jiǎn)單羅列。不要奢望數(shù)據(jù)科學(xué)家會(huì)魔法。一定要明確自身的真實(shí)需求,如果可能的話(huà),在進(jìn)行招聘之前咨詢(xún)專(zhuān)業(yè)人員。企業(yè)數(shù)據(jù)方面的成功取決于以上這幾點(diǎn)。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶(hù) ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱(chēng) BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢(xún)到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢(xún)結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢(xún)結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專(zhuān)注于從單 ...
2025-07-09year_month數(shù)據(jù)類(lèi)型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類(lèi)型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專(zhuān)業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03