
細數(shù)數(shù)據(jù)科學(xué)團隊中的十大關(guān)鍵角色
應(yīng)用數(shù)據(jù)科學(xué)是一項高度跨學(xué)科的團隊工作,需要用多樣性的角度看問題。事實上,比起專業(yè)知識和經(jīng)驗,觀點和態(tài)度的重要性也不容小覷。以下是我對數(shù)據(jù)科學(xué)團隊構(gòu)成的看法。
1. 數(shù)據(jù)工程師
首先在進行數(shù)據(jù)分析之前,我們需要獲取數(shù)據(jù)。如果是處理小型數(shù)據(jù)集,數(shù)據(jù)工程則有點類似在電子表格中輸入數(shù)字;如果是處理更復(fù)雜的數(shù)據(jù)時,那么數(shù)據(jù)工程本身就構(gòu)成了一門復(fù)雜的學(xué)科。首先你的團隊中需要數(shù)據(jù)工程師獲取數(shù)據(jù),從而其他人員能夠在此基礎(chǔ)上進行分析和處理。
2. 決策者
在聘請數(shù)據(jù)科學(xué)家之前,請確保團隊中有充分了解數(shù)據(jù)驅(qū)動決策的角色。決策者需要分辨哪些決策需要數(shù)據(jù)支持,并根據(jù)對業(yè)務(wù)的潛在影響確定分析程度。同時決策者需要深思熟慮,在做決定前進行全方位的思考,考慮到問題的方方面面。
3. 數(shù)據(jù)分析師
每個人都能查看數(shù)據(jù),并從中得出見解,唯一可能缺少的是相關(guān)軟件的使用技能。
學(xué)習(xí)使用R和Python等工具是對數(shù)據(jù)可視化的升級,這些工具功能更豐富,從而能夠查看更多種類數(shù)據(jù)集。
1934年,"尼斯湖水怪"圖
要記住,你不應(yīng)該得出數(shù)據(jù)之外的結(jié)論,這需要專業(yè)培訓(xùn)。就像根據(jù)上面的圖片,你只能說“這就是我的數(shù)據(jù)集中的內(nèi)容”,而不能輕率的得出結(jié)論,尼斯湖水怪是真實存在的。
4. 專家分析師
專家分析師需要更快地查看分析數(shù)據(jù)。這里注重的是分析數(shù)據(jù)、探索和發(fā)現(xiàn)等技能,而不是嚴謹?shù)氐贸鼋Y(jié)論。專家分析師能夠幫助團隊注意更多的數(shù)據(jù),從而決策者能夠更清晰地做出判斷。
但最好不要讓能編寫強大代碼的工程師擔(dān)任這個角色,因為在這方面速度就是一切,需要盡快得出更多分析結(jié)論。因此對代碼要求過高的人很難勝任這個角色。
5. 統(tǒng)計學(xué)家
到這個階段,團隊中已經(jīng)有人對數(shù)據(jù)進行大膽探索了,下面需要有人能在探索中加入理性分析,避免團隊得出無根據(jù)的結(jié)論。
例如,如果你的機器學(xué)習(xí)系統(tǒng)能應(yīng)用于某個數(shù)據(jù)集,那么你能得出結(jié)論,在該數(shù)據(jù)集中這個系統(tǒng)是奏效的。那么能順利用于生產(chǎn)中嗎?能夠進行發(fā)行嗎?這時就需要其他技能來處理這些問題,即統(tǒng)計技能。
如果我們想在可觀事實不夠的情況下做出決定,那么就需要放慢速度并采取謹慎的態(tài)度,這部分就需要統(tǒng)計學(xué)家。
6. 機器學(xué)習(xí)工程師
應(yīng)用人工智能/機器學(xué)習(xí)工程師的價值不是在于理解算法的運行原理,而是能運用這些算法而不是構(gòu)建它們(那是研究人員要做的)。他們需要整理代碼,從而讓其運行在現(xiàn)有的算法和數(shù)據(jù)集中。
除此之外,機器學(xué)習(xí)工程師要能夠應(yīng)對失敗。大多數(shù)時候你不知道自己在做什么,你通過大量的算法運行數(shù)據(jù),在得到預(yù)期結(jié)果前會經(jīng)歷多次的失敗,因此需要能積極地應(yīng)對失敗。
完美主義者很難成為機器學(xué)習(xí)工程師,因為要處理的業(yè)務(wù)問題不像課堂中那樣,你無法事先把握情況,而無法馬上得出預(yù)期的結(jié)果。你所做的只能反復(fù)迭代,嘗試各種解決方案。
數(shù)據(jù)是機器學(xué)習(xí)工程師工作的先決條件,因此在打造數(shù)據(jù)分析團隊早期,聘請數(shù)據(jù)分析師是很有必要的。
機器學(xué)習(xí)工程師在分析過程中還需要進行評估,比如解決方案是否真的適用于新的數(shù)據(jù)。同時出色的機器學(xué)習(xí)工程師要明確采用不同方法分別需要多少時間。
7. 數(shù)據(jù)科學(xué)家
數(shù)據(jù)科學(xué)家在前三個角色都能達到專家級別,具有比較全面的能力。因此在數(shù)據(jù)科學(xué)團隊中數(shù)據(jù)科學(xué)家的薪資比較高。對于企業(yè)而言,如果在預(yù)算內(nèi),雇傭數(shù)據(jù)科學(xué)家是不錯的選擇。但如果預(yù)算不夠,那么可以培養(yǎng)現(xiàn)有團隊中擔(dān)任單一角色的人員。
8. 數(shù)據(jù)分析經(jīng)理/數(shù)據(jù)科學(xué)負責(zé)人
數(shù)據(jù)分析經(jīng)理兼?zhèn)淞藬?shù)據(jù)科學(xué)家和決策者的作用,在團隊中擔(dān)任領(lǐng)導(dǎo)型作用,能夠保持團隊不會迷失方向。
數(shù)據(jù)分析經(jīng)理對團隊有很大的促進作用,但是這方面的人才很少。他們經(jīng)常思考的問題有“如何設(shè)計正確的問題;如何做出決定;如何最好地分配人員;什么值得做;技能和數(shù)據(jù)是否符合要求;如何確保良好的輸入數(shù)據(jù)”等。如果你有幸雇用到了數(shù)據(jù)分析經(jīng)理,請留住他。
9. 定性專家/社會科學(xué)家
團隊中的決策者會是杰出領(lǐng)導(dǎo)者、影響者或?qū)Ш秸?.....但在決策的藝術(shù)性和科學(xué)性方面并不夠。這時可以讓定性專家促進決策者的工作,并補充他們的技能。
定性專家通常具有社會科學(xué)和數(shù)據(jù)背景,能夠幫助決策者理清想法,多角度進行分析,并將模棱兩可的直覺轉(zhuǎn)化為經(jīng)過深思熟慮的指令,以便團隊的其他成員輕松執(zhí)行。比起數(shù)據(jù)科學(xué)家,他們通常更有能力將決策者意圖轉(zhuǎn)化為具體的指標。
10. 研究人員
許多招聘者認為,在打造數(shù)據(jù)科學(xué)團隊一開始就應(yīng)該聘用研究人員,但并非如此。在團隊沒有成型時,即使雇傭研究人員也可能并沒有合適的環(huán)境來發(fā)揮其價值。最好等到團隊發(fā)展到一定程度,有合適的設(shè)備資源時再加入研究人員打造新的工具。
其他角色
除了以上提到的角色,數(shù)據(jù)科學(xué)團隊中還可以加入以下角色:
· 領(lǐng)域?qū)<?
· 倫理學(xué)家
· 軟件工程師
· 可靠性測試工程師
· UX設(shè)計師
· 交互式可視化/圖形設(shè)計師
· 數(shù)據(jù)收集專家
· 數(shù)據(jù)產(chǎn)品經(jīng)理
· 項目經(jīng)理
除了前面提到的十大角色,許多數(shù)據(jù)科學(xué)項目還需要以上人員的參與。他們都有自己主攻的專業(yè)領(lǐng)域,在團隊中是很好的補充。
大團隊還是小團隊?
看到這里你可能會感到壓力,但在具體構(gòu)建數(shù)據(jù)科學(xué)團隊時,可以根據(jù)企業(yè)的自身情況而定。
這里可以把應(yīng)用機器學(xué)習(xí)類比為開餐廳,如果你想開一家制作創(chuàng)新披薩的大型披薩店,那么就需要大型團隊。你要決定做什么菜(角色2),使用哪些食材(角色3和4),在哪里獲得食材(角色1),如何定制菜單(角色6),以及如何對菜品進行測試(角色5)。但如果你的目標只是制作普通的披薩,則不需要這么復(fù)雜,采用已測試過的菜單,加上食材就可以開始了。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03