
互聯(lián)網(wǎng)公司如何組建數(shù)據(jù)科學(xué)團隊
今天近乎所有的互聯(lián)網(wǎng)公司都希望組建(大)數(shù)據(jù)分析團隊,但由于大數(shù)據(jù)技術(shù)應(yīng)用是一個高速發(fā)展的全新領(lǐng)域,與建設(shè)常規(guī)的軟件開發(fā)團隊相比,企業(yè)在數(shù)據(jù)科學(xué)團隊的招聘、建設(shè)和成長方面面臨各種全新的挑戰(zhàn)。
對于人力資源經(jīng)理來說,大數(shù)據(jù)分析人才的招聘說明中有太多的生詞,包括各種大數(shù)據(jù)新鮮名詞、算法和技能,而且整個技術(shù)人才市場對大數(shù)據(jù)經(jīng)驗、最佳實踐的定義和標(biāo)準(zhǔn)尚無定論。
近日Experteer的Rodrigo Rivera為VB撰文指出,企業(yè)組建大數(shù)據(jù)分析團隊首先需要搞清楚以下三個問題:數(shù)據(jù)分析團隊在企業(yè)組織架構(gòu)中的智能定位、所需資源以及數(shù)據(jù)分析團隊的架構(gòu)。
職能定位
企業(yè)上下需要在一開始就明確數(shù)據(jù)分析團隊在企業(yè)組織架構(gòu)中的定位,以及主要的利益相關(guān)者。
不同企業(yè)的做法不同,有的企業(yè)讓CTO領(lǐng)導(dǎo)數(shù)據(jù)科學(xué)團隊,有的則選擇讓CFO甚至CMO領(lǐng)導(dǎo),有的選擇由一個項目經(jīng)理統(tǒng)領(lǐng)分散于不同業(yè)務(wù)部門的數(shù)據(jù)專家,還有一些企業(yè)將數(shù)據(jù)科學(xué)團隊定位于研發(fā)團隊,沒有具體的日程表或利益相關(guān)者。
以上取決于企業(yè)的組織模式、企業(yè)文化、資源和數(shù)據(jù)科學(xué)團隊的具體任務(wù)。由于數(shù)據(jù)科學(xué)如此性感,企業(yè)的高官們都想將其納入自己的管轄范圍,因此如果不能事先明確數(shù)據(jù)科學(xué)團隊的職能定位,在日后的運營中勢必引起各部門之間的困惑和摩擦。
資源需求
了解技術(shù)人才市場的人都知道,數(shù)據(jù)科學(xué)人才的身價不菲,而企業(yè)往往在組建數(shù)據(jù)科學(xué)團隊前對資源需求估計不足。
對于一個超過300人的互聯(lián)網(wǎng)公司來說,如果想組建一個有明確任務(wù)(例如推薦引擎、用戶激活等)的數(shù)據(jù)科學(xué)團隊,第一階段可以考慮組建一個5-8人的團隊,包括一名技術(shù)項目經(jīng)理、1-2名負(fù)責(zé)建模的數(shù)據(jù)科學(xué)家,以及3-5名數(shù)據(jù)工程師負(fù)責(zé)部署生產(chǎn)代碼。
團隊構(gòu)成
當(dāng)明確了資源需求和團隊規(guī)模后,下一步面臨的問題是如何找到合適的數(shù)據(jù)科學(xué)人才。正如文章開頭提到的,這對于企業(yè)的人力資源部門來說幾乎是個不可能完成的任務(wù),人力資源經(jīng)理的郵箱會迅速被充斥各種新鮮技術(shù)名詞的簡歷填滿。
人力資源部門還非常容易受到媒體或數(shù)據(jù)分析廠商的影響,企業(yè)需要根據(jù)需求自行定義招聘說明中的技能要求,例如教育背景與實操經(jīng)驗的孰重孰輕等。當(dāng)然,這些都是說起來容易做起來難。
以8人數(shù)據(jù)科學(xué)團隊為例,團隊初創(chuàng)成員大致分為以下三類:
1.技術(shù)項目經(jīng)理。擁有3到5年的相關(guān)團隊管理和項目經(jīng)驗;最好擁有扎實的技術(shù)背景,最好能夠編程(雖然并不需要真的去編程)。數(shù)據(jù)分析團隊的技術(shù)項目經(jīng)理不僅僅需要豐富的項目管理經(jīng)驗,還必須了解數(shù)據(jù)分析相關(guān)的算法和技能,最好能夠進行代碼審核。
2.數(shù)據(jù)科學(xué)家。數(shù)據(jù)科學(xué)家要求有廣泛而扎實的專業(yè)背景,最好擁有物理學(xué)、數(shù)學(xué)、計算機科學(xué)、生物學(xué)或相關(guān)學(xué)科領(lǐng)域的博士學(xué)位。判斷數(shù)據(jù)科學(xué)家水平最簡單的依據(jù)是她曾經(jīng)發(fā)表過的研究論文質(zhì)量。
有一點需要注意的是,一位機器學(xué)習(xí)領(lǐng)域的資深專家很可能軟件開發(fā)技能很差,因此在考察數(shù)據(jù)科學(xué)家技能時不要想當(dāng)然,務(wù)必要明確其編程技能。對于以應(yīng)用為主的互聯(lián)網(wǎng)企業(yè)來說,編程技能對于一個初創(chuàng)的數(shù)據(jù)科學(xué)團隊來說非常重要,除非你要組建的是一個學(xué)術(shù)性的數(shù)據(jù)科學(xué)團隊。
3.數(shù)據(jù)工程師。不需要太多學(xué)術(shù)背景,只要是對數(shù)據(jù)分析感興趣的靠譜的軟件開發(fā)人員都可勝任。數(shù)據(jù)工程師需要對算法、數(shù)據(jù)架構(gòu)和軟件工程有深入了解,尤其是算法層面,因為很多軟件工程師這方面的知識很薄弱,而對于數(shù)據(jù)科學(xué)團隊來說算法至關(guān)重要。可以嘗試從開源項目的積極貢獻者中去尋找未來的數(shù)據(jù)工程師。通常對數(shù)據(jù)工程師的技能要求與數(shù)據(jù)科學(xué)家類似(例如Python、Scala等)
以上每類數(shù)據(jù)科學(xué)人才的招聘要求視企業(yè)和預(yù)算的不同而異,團隊組建初期沒必要招聘太過資深的人士,因為在團隊職能和領(lǐng)域范圍在初期會經(jīng)歷比較大的變動。而且數(shù)據(jù)科學(xué)團隊初期由于需要搭建數(shù)據(jù)平臺,清洗數(shù)據(jù),需要干大量“臟活”
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03