
2018-11-02
在大數(shù)據(jù)和機(jī)器學(xué)習(xí)的時代,有一種職業(yè)脫穎而出——數(shù)據(jù)科學(xué)家。數(shù)據(jù)科學(xué)家在近年來備受追捧,也有越來越多的人想投身入數(shù)據(jù)科學(xué)領(lǐng)域。
最近,CDA 采訪了幾位來自不同行業(yè)的數(shù)據(jù)科學(xué)團(tuán)隊負(fù)責(zé)人,聊聊他們眼中的數(shù)據(jù)科學(xué)家是什么樣的,以及對于初入數(shù)據(jù)科學(xué)行業(yè)的人群有些什么建議。
今天請到的是來自星窗科技的首席數(shù)據(jù)科學(xué)家——薛松,讓我們看看研發(fā)總裁眼中的數(shù)據(jù)科學(xué)家是什么樣的吧。
點擊播放采訪視頻,建議wifi下播放
http://edu.cda.cn/course/946/task/16003/show
以下是采訪的文字整理部分。
薛松 星窗科技 首席數(shù)據(jù)科學(xué)家
大家好,我叫薛松。在美國畢業(yè)之后,我先是在美國華盛頓的一家大數(shù)據(jù)公司做數(shù)據(jù)科學(xué)家,后來回到中國加入了一個初創(chuàng)公司,現(xiàn)在在初創(chuàng)公司里擔(dān)任首席數(shù)據(jù)科學(xué)家。
Q1:請您介紹一下,目前您從事的數(shù)據(jù)科學(xué)相關(guān)的工作內(nèi)容?
我們的主要工作是幫助企業(yè)客戶,尤其是中小型企業(yè)客戶搭建數(shù)據(jù)平臺,在挖掘他們的數(shù)據(jù)核心價值。
我們團(tuán)隊的核心工作可以歸納為是數(shù)據(jù)的產(chǎn)品化。像我們之前幫助一些金融領(lǐng)域的客戶,他們會有一些個人客戶的信貸需求。那么他們掌握了這些個人用戶的信貸資料,我們會幫他們在這些信貸資料的基礎(chǔ)上面進(jìn)行一些數(shù)據(jù)挖掘。獲取這個人的信用記錄,并且去構(gòu)建這些人與人之間的關(guān)系網(wǎng)絡(luò),從這個關(guān)系網(wǎng)絡(luò)中去了解一個人的信用程度。利用大數(shù)據(jù)分析利用數(shù)據(jù)科學(xué),去幫他們準(zhǔn)確的判斷每個人的信用程度,并且提供相應(yīng)的授信額度,那么這是我們應(yīng)用的一個案例。
Q2:您覺得當(dāng)下企業(yè)需要的數(shù)據(jù)科學(xué)家應(yīng)該具備哪些技能?
硬技能這些專業(yè)性的技能其實都不用說了,大家也都知道。
首先編程的核心技能對于數(shù)據(jù)科學(xué)家是非常重要的,這方面可能不需要你像程序員樣那么精通,但是最基本的這些編程的技能是肯定要有的。
其次我想強(qiáng)調(diào)的是這也可能是很多人忽視的一點,就是在統(tǒng)計基礎(chǔ),也就是統(tǒng)計的基本思想,以及對于這些機(jī)器學(xué)習(xí)算法、人工智能算法的統(tǒng)計精神的理解。我想這就是將數(shù)據(jù)科學(xué)家和程序員區(qū)分開的一個重要標(biāo)志。
數(shù)據(jù)科學(xué)家他們會對底層的統(tǒng)計思想掌握的更清晰,他們很明白地了解到算法的適用場景適用的數(shù)據(jù)類型適用的問題,那么他們在實際工作中常常是為程序員提供了相當(dāng)于守門員的作用。他們會知道什么樣的算法適用于什么樣的場景,而不是簡單地去調(diào)包去使用算法,那么這是硬技能的部分。
在軟技能方面,首席數(shù)據(jù)科學(xué)家更需要具有良好的溝通能力。
因為在實際工作中,數(shù)據(jù)科學(xué)家往往是需要和不同團(tuán)隊不同部門不同層級的人員去溝通,去協(xié)調(diào)去獲取各方面的資源去獲取各方面的支持。因此數(shù)據(jù)科學(xué)家的溝通能力是要比在企業(yè)的其他部門,其他的這些技術(shù)人員要更強(qiáng)的要求更高。
其次是邏輯思維的能力。因為數(shù)據(jù)科學(xué)家相比于更基層一點的數(shù)據(jù)分析師,或者是其他的數(shù)據(jù)工程師這些人員來講,他需要能夠把握問題的核心關(guān)鍵所在,能夠?qū)①Y源集中于這些最關(guān)鍵最核心的問題。因此數(shù)據(jù)科學(xué)家需要能夠條理很清楚地去分析問題,去找到問題的核心關(guān)鍵所在。因此
邏輯思維能力和分析問題的能力,是數(shù)據(jù)科學(xué)家的一個重要的軟能力。
Q3:結(jié)合您在國外的經(jīng)歷,您覺得中外數(shù)據(jù)科學(xué)家的區(qū)別在哪?
我覺得這個問題是非常好的一個問題。在國內(nèi)和國外的一個非常大的區(qū)別在于,在美國專業(yè)性的壁壘會比中國更沒有這么明顯。
在美國會看到很多來自不同背景的人去做數(shù)據(jù)分析師,像我之前的同事有學(xué)經(jīng)濟(jì)的,有學(xué)生物的,有學(xué)物理的,那么他們?nèi)プ鰯?shù)據(jù)分析師去做數(shù)據(jù)科學(xué)家其實是各有各的長處。有的更擅長分析商業(yè)問題,有的更擅長數(shù)學(xué)公式的推導(dǎo),有的更擅長寫代碼,這樣的團(tuán)隊中集聚了各方面人才的能力,并且大家能夠沒有障礙沒有隔閡的交流,形成的戰(zhàn)斗力是遠(yuǎn)遠(yuǎn)比大家來自同一背景的人要強(qiáng)得多的。
在國內(nèi),大家可能背景會趨同,很多數(shù)據(jù)分析師和數(shù)據(jù)科學(xué)家都是來自于理工科,甚至全部都是計算機(jī)背景的人士。大家的技術(shù)水平都很高,但是實際上我們可能缺乏了這種互補性,而且往往對于實際問題來講是需要能夠從不同的角度來看這個問題,需要來自各方面的智慧。
這一點我是覺得國內(nèi)和國外的一個很大的區(qū)別。而且我也希望能夠有越來越多來自不同背景的人能夠加入到數(shù)據(jù)分析師數(shù)據(jù)科學(xué)家的行列,為我們帶來不同角度的視角,更多的視野。所以這也是我覺得CDA培訓(xùn)對于這些非理工科,尤其是非計算機(jī)專業(yè)同學(xué)的一個很大的價值。能夠讓他們跨越專業(yè)壁壘,能夠投入到數(shù)據(jù)科學(xué)這一個充滿激情的行業(yè)中來。
Q4:您認(rèn)為數(shù)據(jù)科學(xué)家需要具備的一個核心能力是什么?
我覺得在實踐工作中既然到數(shù)據(jù)科學(xué)家這個層次,那么他和我們說數(shù)據(jù)分析師或者再基層一點的商業(yè)分析師之間有所不同,重要區(qū)別在于我們通常會對數(shù)據(jù)科學(xué)家有領(lǐng)導(dǎo)才能的期待。而在實踐中這種領(lǐng)導(dǎo)力,往往不是通過一個具體的職位反映出來的,就是我們說這種leadership without leader role。
就是說在實際工作中,數(shù)據(jù)科學(xué)家扮演的角色往往是一個領(lǐng)導(dǎo)性的角色,但是他常常并不具有領(lǐng)導(dǎo)的頭銜。所以他很多時候是需要跨團(tuán)隊協(xié)作,跨團(tuán)隊調(diào)動資源帶領(lǐng)一個團(tuán)隊,但事實上他又沒有強(qiáng)有力的手段,能夠去推動事情的進(jìn)展和落地。
所以我覺得數(shù)據(jù)科學(xué)家一個很重要的能力,就是說在沒有正式的頭銜的時候,去推動項目往前走。
推動項目的實施和落地的能力,那么就需要他有強(qiáng)大的溝通技巧。一方面,和其他團(tuán)隊間的溝通能力。另一方面,向上管理的能力。就是和自己的領(lǐng)導(dǎo)和這些公司企業(yè)的高層和外部的客戶去溝通,推動自己的想法,推動自己項目的進(jìn)展。
這部分能力我認(rèn)為是對于數(shù)據(jù)科學(xué)家來講,是在職業(yè)道路上進(jìn)一步上升的一個很重要的能力,可以說是最關(guān)鍵的能力。
Q5:請您給一些正在職場打拼的數(shù)據(jù)分析師、數(shù)據(jù)工程師們一些職業(yè)發(fā)展建議!
我的建議首先是繼續(xù)實踐,就是像英語里面說get your hands dirt,任何能夠去動手做一些事情的時候,就去動手做一件事情,實踐是最好的導(dǎo)師。
第二點,盡量的能夠成為一個全棧的人才。就是說作為數(shù)據(jù)科學(xué)家而言,你不僅僅是說要掌握機(jī)器學(xué)習(xí),要掌握數(shù)據(jù)分析的能力。同時你要能夠?qū)⒄麄€項目推動往前走,必須了解項目的方方面面,而且能在有必要的時候,自己能夠去做項目中其他的事情。所以成為全棧的數(shù)據(jù)科學(xué)家,成為全棧的人才,這是成長為數(shù)據(jù)科學(xué)家的一個必經(jīng)之路。
此外,要去了解敏捷開發(fā),去實踐敏捷開發(fā)。因為數(shù)據(jù)科學(xué)家和單純的開發(fā)人員一個很大不同是,我們往往要面對著非常不確定的環(huán)境去工作。那么這個不確定性表現(xiàn)在目標(biāo)往往是不確定,含糊不明確的團(tuán)隊往往是不明確的,你所能夠調(diào)動所擁有的資源也是不明確的,你需要將項目推進(jìn)。
只有通過快速的迭代,快速的敏捷開發(fā)能夠一步一步的把項目逐漸實現(xiàn),所以敏捷性開發(fā)的流程工作是數(shù)據(jù)科學(xué)家工作中一個重要的一環(huán)。
Q6:您對CDA LEVEL 3數(shù)據(jù)科學(xué)家人才標(biāo)準(zhǔn)有何建議和期待?
我認(rèn)為,既然能夠參加level 3的數(shù)據(jù)科學(xué)家,應(yīng)該是CDA這個體系里邊最高水準(zhǔn)的人才。那么對于這個層次的人才,我有三點期望。
第一,有非常強(qiáng)的實踐能力。就像前面說的這是一個數(shù)據(jù),科學(xué)家是全棧的人才,作為一名數(shù)據(jù)科學(xué)家,他能夠擔(dān)當(dāng)項目的方方面面,并且能夠在其中扮演領(lǐng)導(dǎo)性的角色。所以實踐性我認(rèn)為是level 3數(shù)據(jù)科學(xué)家的首要考核標(biāo)準(zhǔn)。
第二,有扎實的理論基礎(chǔ)。這與level 1 level 2的人不一樣,不僅僅是說我要能夠去應(yīng)用這些算法,能夠去應(yīng)用這些現(xiàn)成的工具解決問題,并且還需要知道這些算法的局限性在哪里,這些算法的應(yīng)用場景它背后的統(tǒng)計原理在哪里。所以這些對于數(shù)據(jù)科學(xué)家來講,他的理論基礎(chǔ)一定要扎實。
第三,數(shù)據(jù)科學(xué)家應(yīng)當(dāng)是一個T型人才。一方面要有廣度,另一方面又需要有自己的深度。因此對于數(shù)據(jù)科學(xué)家而言,他應(yīng)當(dāng)在作為全棧型人才的基礎(chǔ)上,同時有自己所擅長所精通的地方。這個可以是某一種具體的算法,某一項業(yè)務(wù),在某一個業(yè)務(wù)場景,某一個行業(yè)里邊成為專家。以上這三點是我對于Level 3數(shù)據(jù)科學(xué)家的一個期望。
現(xiàn)在我已經(jīng)做了7、8年的數(shù)據(jù)科學(xué)家,也經(jīng)常自己在市場上招人,碰到的一個很大的問題就是,我們很難有一個客觀的標(biāo)準(zhǔn)去判斷什么樣是優(yōu)秀的人才,什么樣是符合我們要求的數(shù)據(jù)科學(xué)家。我期待CDA level 3的數(shù)據(jù)科學(xué)家認(rèn)證能夠為我們提供選擇人才的黃金標(biāo)準(zhǔn),能夠選拔出來真正符合企業(yè)需要,能夠成為一個優(yōu)秀的數(shù)據(jù)科學(xué)家這樣的人才。
如何進(jìn)階為數(shù)據(jù)科學(xué)家
CDA LEVEL 3數(shù)據(jù)科學(xué)家精英培訓(xùn)已正式發(fā)布,旨在面向從業(yè)多年的、有技術(shù)基礎(chǔ)的大數(shù)據(jù)及數(shù)據(jù)分析專業(yè)人士、數(shù)據(jù)工程師等,為他們提供一個成為數(shù)據(jù)領(lǐng)袖的跳板。了解更多詳情:http://www.3lll3.cn/kecheng/53.html
完 謝謝觀看
相關(guān)閱讀