
正確的理解,是玩轉(zhuǎn)大數(shù)據(jù)的前提
眼下,無論是高校還是科研機構(gòu),以“大數(shù)據(jù)”為關(guān)鍵詞的研討會一撥接著一撥,云計算、物聯(lián)網(wǎng)、智能終端……這些新概念串燒著出現(xiàn),仿佛“大數(shù)據(jù)(數(shù)據(jù)分析師)”正撬動著一個非“技術(shù)宅”免進的新世界。
到底什么是大數(shù)據(jù)的真面目?英國帝國理工學(xué)院終身教授、帝國理工數(shù)據(jù)科學(xué)研究所所長郭毅可給出的卻是一個舉重若輕的解釋?!按髷?shù)據(jù)首先不是概念,而是一種現(xiàn)象、一種新發(fā)現(xiàn)的資源。就如同人類發(fā)現(xiàn)了新的石油一樣——對大數(shù)據(jù)的發(fā)掘意味著可以創(chuàng)造財富,也正因此,大數(shù)據(jù)(數(shù)據(jù)分析師認證)會引發(fā)一系列的技術(shù)革命?!?
9個月前,郭毅可接過上海大學(xué)的聘書,成為該校計算機學(xué)院院長。而在剛剛過去的2015年,這位學(xué)者走進更多中國人的視線,乃是因為國家主席習(xí)近平在訪英時參觀了郭毅可在帝國理工的研究所并聽取了他的關(guān)于大數(shù)據(jù)研究的報告。這位學(xué)者是如何玩轉(zhuǎn)大數(shù)據(jù)的,在上海大學(xué)計算機學(xué)院,本報記者獨家專訪了郭毅可教授。
大數(shù)據(jù)牽引計算機發(fā)展新方向:過去的支流將是今后的主流
對于大數(shù)據(jù),學(xué)界說法很多。按照郭毅可的看法,大數(shù)據(jù)其實一直存在,只是發(fā)展至今,它成為一種像電、石油一般可以創(chuàng)造財富和價值的資源時,開始引發(fā)上、下游的一系列技術(shù)革命。
由此,各種玄乎的、計算機專家碰頭時如數(shù)家珍的新概念,在郭毅可的解讀中變得十分容易理解。比如,大數(shù)據(jù)的生成需要各種儀器,所以物聯(lián)網(wǎng)、醫(yī)療基因測序等得以生成各種數(shù)據(jù)的儀器設(shè)備便風(fēng)生水起。再如,對大數(shù)據(jù)這種“資源”進行處理,需要大規(guī)模使用計算機,“云計算”、智能終端的重要性得以凸顯,它們不僅處理數(shù)據(jù),也同時輸送數(shù)據(jù),繼而產(chǎn)生新數(shù)據(jù)。
“在大數(shù)據(jù)所引發(fā)的一系列技術(shù)革命中,最為重要的是它對計算機科學(xué)的發(fā)展方向產(chǎn)生了根本性的影響。”郭毅可說,因為處理大數(shù)據(jù)的客觀需要,計算機的“產(chǎn)出”正在發(fā)生改變。過去,計算機主要被用于模擬、高性能計算以及處理管理信息,而現(xiàn)在,計算機則被看作是大數(shù)據(jù)產(chǎn)品的生成器。所以,在計算機業(yè)界,包括高效的數(shù)據(jù)處理技術(shù)、機器學(xué)習(xí)等,眼下都成了最熱門的研究方向。
“更直白地說,步入大數(shù)據(jù)時代,整個計算機科學(xué)的研究重點和使用方法都變了——計算機更向“智”的方向發(fā)展?!惫憧蛇@樣解釋個中緣由:因為要把數(shù)據(jù)生成為各種產(chǎn)品,這本應(yīng)是人的“工作”——人通過觀察做出反應(yīng)和決策。而觀察的行為,其本質(zhì)是收集數(shù)據(jù),反應(yīng)和決策則會產(chǎn)出新的數(shù)據(jù)?!斑@就是為什么類腦計算機、人工智能會從過去的計算機科學(xué)的支流變成今天的主流?!惫憧烧f。
受聘上海大學(xué)計算機學(xué)院院長后,郭毅可專門囑咐工作人員做了一件小事:在學(xué)院大樓門口處,緊挨著計算機學(xué)院的Logo,全新安裝了一個寫著“智”字的銘牌。“所有跟人的智能相關(guān)的,都將是計算機科學(xué)要研究的領(lǐng)域?!弊鳛橐幻嬎銠C學(xué)院的教授,他試圖用這一個字來解釋大量學(xué)生們心中糾纏的關(guān)于“計算機科學(xué)應(yīng)該學(xué)什么”的疑惑。
大數(shù)據(jù)研究:比起賺錢,更值得研究的是民生項目
和傳統(tǒng)的高校計算機系教授稍有不同,聽郭毅可談他的研究方向,對“大數(shù)據(jù)”一竅不通的外行人都會覺得新鮮。而他的研究項目合作者中,除了理工科的教授,還有不少從事社會科學(xué)研究的學(xué)者和各路企業(yè)界的人士。最近,他正興致勃勃地和一些媒體界的人士接觸,探討用數(shù)據(jù)可視化的新形式拍紀錄片,研究目標說來很有趣:讓一些“高大上”的政治話題,也能被平頭百姓輕松接受。
以中國的“一帶一路”戰(zhàn)略為例。除了讓國民理解“一帶一路”帶來的諸多益處,如何也同時向沿線的外國民眾解釋好中國的“一帶一路”?按照郭毅可的見解,與其干巴巴地宣傳政策,不如讓數(shù)字來說話。比如,修通一條鐵路后,能為沿線的國家新增多少就業(yè)率,會讓當?shù)匚拿ぢ式档投嗌?、人口預(yù)期壽命增長多少。
從專業(yè)角度來講,這類“數(shù)據(jù)可視化”的研究是郭毅可目前最感興趣的研究方向。作為學(xué)者,他堅信一點:數(shù)據(jù)除了可以賺錢、創(chuàng)造財富,更大的價值在于服務(wù)民生。
去年10月,習(xí)近平主席造訪英國理工,參觀該校的數(shù)據(jù)科學(xué)研究所時,郭毅可用數(shù)據(jù)可視化的方式,分析了中國人口遷移的情況,“一帶一路”政策的國際影響力、個性化醫(yī)療的推廣以及上海地鐵的負載分布和應(yīng)急辦法等。
實際上,因為這條公共新聞的披露,很多圈內(nèi)人才恍然大悟:原來上海地鐵運營狀況的“大數(shù)據(jù)”,被送去了帝國理工做分析!
為什么不是上海本地的高校而是帝國理工更受上海地鐵公司的青睞?郭毅可“嘿嘿”一笑,坦然作答:“要知道,倫敦的地鐵可是世界上最古老的,我們‘玩地鐵’可以玩出很多精彩的東西?!?
事實上,這輕描淡寫的一句中,隱藏著很多信息。如郭毅可接受本報記者采訪時所言,在帝國理工的數(shù)據(jù)科學(xué)研究所,他經(jīng)常要接待主動捧著數(shù)據(jù)上門的“客戶”。很多在一些國內(nèi)同行看來被機構(gòu)、組織所壟斷、難以得手的數(shù)據(jù),卻頻頻對郭毅可所在的研究所“開綠燈”。由此反觀,最近兩年間,奔著大數(shù)據(jù)的美好前景,國內(nèi)很多大學(xué)和研究機構(gòu)都忙著掛牌成立大數(shù)據(jù)研究機構(gòu)。但真實的情況往往是,這邊才揭牌,那頭抱怨就來了:堂堂數(shù)據(jù)研究院,卻苦于手上無數(shù)據(jù),必須要自己找尋研究方向。
“沒有數(shù)據(jù)的大數(shù)據(jù)研究院毫無意義。”郭毅可直言不諱:大數(shù)據(jù)研究,關(guān)鍵是要讓數(shù)據(jù)產(chǎn)生價值。因此,“與其抱怨自己拿不到數(shù)據(jù),不如好好思考一下,你的研究能夠為數(shù)據(jù)擁有者解決什么問題。”
【獨家對話】大數(shù)據(jù)時代,計算機系應(yīng)辦成教育特區(qū)
就業(yè)率這種指標,怎么能用來作為計算機系的KPI?!
文匯報:有人做過統(tǒng)計,在中國的理工科大學(xué)中,開設(shè)專業(yè)最多、錄取人數(shù)最多的就是計算機專業(yè)。所以在不少省市教育主管部門發(fā)布的高校本科專業(yè)預(yù)警名單中,計算機專業(yè)這兩年頻頻上榜。作為上海大學(xué)新任的計算機學(xué)院院長,您對這樣的情況怎么看,怎么評價?
郭毅可:請問現(xiàn)在是什么時代?“大眾創(chuàng)新、萬眾創(chuàng)業(yè)”、“互聯(lián)網(wǎng)+”!請問在高校,哪個專業(yè)和它們最對口?答案肯定是計算機專業(yè)。所以誰要是說計算機專業(yè)沒前途,我肯定不認同。關(guān)鍵的問題在于,高校的計算機專業(yè)有點跟不上形勢發(fā)展,這個我們必須要承認,要拿出解決的方案。
但在此之前,我要指出一點,把計算機專業(yè)列入本科預(yù)警名單似乎不太合理。
我們首先要問,統(tǒng)計學(xué)意義上的“計算機專業(yè)”到底指什么?如果把那些從事計算機制造的納入統(tǒng)計,那么專業(yè)就業(yè)率低,或許可以理解;但事實上,目前響應(yīng)“互聯(lián)網(wǎng)+”,在互聯(lián)網(wǎng)上工作的人都在從事計算機科學(xué)。所以,拿“就業(yè)率”這個指標去作為大學(xué)計算機專業(yè)的KPI(關(guān)鍵績效指標),實在太不合理了。計算機專業(yè)辦得好不好?需要用創(chuàng)業(yè)率去考核,而不是學(xué)生的簽約率。
無論是在美國還是英國,一流大學(xué)計算機系最拔尖的學(xué)生基本上都去創(chuàng)業(yè)了,二流的去了金融機構(gòu)。如果今天我們的高校還在拿簽約率、進500強企業(yè)作為衡量計算機專業(yè)辦得好不好的標準,這種陳舊的管理觀念真是要改一改了。
計算機專業(yè)不是授課授出來的,而是打拼出來的
文匯報:正如您所說,大數(shù)據(jù)時代的到來對計算機科學(xué)產(chǎn)生了根本性的影響。計算機科學(xué)發(fā)展如此迅猛,大學(xué)教育應(yīng)該怎么辦?
郭毅可:計算機科學(xué)發(fā)展正在迎來最好的時期。已有一些科學(xué)家預(yù)言,未來25年內(nèi)(數(shù)據(jù)分析培訓(xùn)),計算機將達到人腦水平,當然,這會對人類社會的發(fā)展產(chǎn)生多方面的影響和沖擊,但是這也是計算機科學(xué)發(fā)展歷史上第一次接近到理想的邊緣——和人一樣,具有智慧。
所以大學(xué)目前需要應(yīng)對的危機并不是計算機科學(xué)的危機,而是計算機專業(yè)辦學(xué)的危機??紤]到計算機迅猛的發(fā)展態(tài)勢,大學(xué)計算機學(xué)院需要辦成一個教育特區(qū),需要定制課程和教育方案。打個最簡單的比方,我回國后發(fā)現(xiàn),很多大學(xué)計算機系的學(xué)生花了很多時間在聽課、聽滿堂灌的大課。我覺得很奇怪,因為在帝國理工,計算機系學(xué)生上課的時間很少,都是小班授課,老師講課速度極快,學(xué)生們更多的時間是在實驗室里做各種項目??傊痪湓挘嬎銠C專業(yè)不是授課授出來的,而是打拼出來的。
中國高校對老師的要求是“全才”,而我們也需要同時用好“偏才”
文匯報:理想的教學(xué),關(guān)鍵在師資。您回國后出任學(xué)院院長,對本土教師有何評價?按照您的改革設(shè)想,一旦學(xué)院課程改革啟動,本土教師能夠承擔起重任嗎?
郭毅可:我無法對中國大學(xué)教師的總體水平作評價,但就我在上海大學(xué)擔任院長的這9個月的時間,在接觸了大量老師后,我覺得我們的師資非常棒,不管是本土培養(yǎng)的還是國外回來的,水平并不差。而眼下的關(guān)鍵問題是,要讓老師專注地做他們真正有興趣的事情,而不是為了滿足各種指標、考評的需要,讓他們忙得團團轉(zhuǎn)。
要說論文、科研指標,世界上所有的大學(xué)其實都有KPI考核。帝國理工也一樣,但除了校長對外會介紹各類指標的完成情況外,教授群體本身不會太在意。
什么是真正一流的大學(xué)?在我看來,就是要凝聚一批學(xué)者,他們以為人類做出重大貢獻、產(chǎn)生讓人類銘記的研究為目標。有了這樣一批學(xué)者當老師,繼而把做科研的樂趣傳遞給年輕的學(xué)生,讓他們覺得青春時代受到很好的教育——這樣的大學(xué)就是一流大學(xué)。
從國外回來,我一個比較明顯的感受是,中國很多高校對老師的要求是“全才”,希望老師科研教學(xué)樣樣好,而我們的很多老師或許是出于知識分子的尊嚴,每天忙著“達標”,過得有點累。實際上,能夠成為“全才”當然好,但有時候“全才”也意味著各方面發(fā)展比較平均。與之相應(yīng),在某些方面具有能力特長的偏才,高校也應(yīng)該學(xué)會揚長避短,承認差異,給他們以同樣寬闊的發(fā)展平臺。
無論是對學(xué)校、對院系還是對教師的考核,KPI是一種有效的方法,但與此同時,它也有不合理之處。因為KPI是“一刀切”的指標體系,是會謀殺個性的。在這一方面,我們不妨拿出點中國人的傳統(tǒng)智慧,比如借鑒一下陰陽理論。如果KPI是“陽”,那我們還需要設(shè)計一個更富彈性的評價機制去加以平衡、綜合。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
AI 浪潮下的生存與進階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導(dǎo)白皮書) 發(fā)布機構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04