
大數(shù)據本科專業(yè)申報及認識
互聯(lián)網、云計算、移動計算等新興技術拓展了人類創(chuàng)造和利用信息的范圍和模式。聯(lián)合國在2012年發(fā)布的大數(shù)據白皮書《大數(shù)據促發(fā)展:挑戰(zhàn)與機遇》中指出,大數(shù)據時代已經到來,大數(shù)據的出現(xiàn)將會對社會各個領域產生深刻影響。2013年被稱為中國大數(shù)據元年,各行各業(yè)開始高度關注大數(shù)據的研究和應用。在云計算技術、非結構化數(shù)據存儲技術的助力下,大數(shù)據已經成為當前學術界、工業(yè)界的熱點和焦點。從公司戰(zhàn)略到產業(yè)生態(tài),從學術研究到生產實踐,從城鎮(zhèn)管理乃至國家治理,都將發(fā)生本質的變換,大數(shù)據將成為時代變革的力量?!坝脭?shù)據來說話、用數(shù)據來管理、用數(shù)據來決策、用數(shù)據來創(chuàng)新”的文化氛圍與時代特征愈發(fā)鮮明。大數(shù)據時代新特征要求設計和構建相應的管理決策分析模型與方法,有效地將信息科學和商業(yè)應用相結合。因此,掌握大數(shù)據核心技術且同時擁有“經管”專業(yè)知識的人才儲備將成為國家大數(shù)據戰(zhàn)略布局的重中之重。
1 產業(yè)發(fā)展需要大數(shù)據人才
與大數(shù)據概念知名度和企業(yè)熱情形成對比的是,大數(shù)據正面臨全球性的人才荒。企業(yè)對新型大數(shù)據分析和預測技術人才的熱情和需求正在超過傳統(tǒng)的商業(yè)智能和信息管理人才。根據麥肯錫報告,僅僅在美國市場,2018年大數(shù)據人才(包括高級數(shù)據分析專家)缺口將高達19萬。此外美國企業(yè)還需要150萬能夠提出正確問題并運用大數(shù)據分析結果的大數(shù)據相關管理人才。商業(yè)數(shù)據分析是現(xiàn)在全美增長最迅速的領域,據NewVantagePartners公司對美國《財富》500強公司調查顯示:85%的500強企業(yè)已經或正在籌劃推出大數(shù)據項目,未來幾年這些企業(yè)在數(shù)據分析上的投資將平均上漲36%?!豆鹕虡I(yè)評論》的一篇文章將數(shù)據分析稱作“21世紀最熱門的職業(yè)”。人力資源公司Kforce的調研報告預測2014年全球大數(shù)據相關的八大職業(yè)平均年薪將達到11.75萬~14.06萬美元。中國是人才大國,但掌握和應用大數(shù)據技術的創(chuàng)新人才仍是稀缺資源,培養(yǎng)大數(shù)據相關人才成為最為緊迫的問題。在這樣的形勢下,對外經濟貿易大學于2015年7月向教育部申報開設“大數(shù)據科學與應用(目錄外)”本科專業(yè)。
2 “數(shù)據科學”的時代性、科學性與合理性分析
“大數(shù)據”已經成為全球科技界和企業(yè)界關注的熱點。數(shù)據為王的時代已經到來,企業(yè)關注的重點從追求計算機的計算速度轉變?yōu)榇髷?shù)據處理能力,從以軟件編程為主轉變?yōu)橐詳?shù)據為中心。2012年3月,美國奧巴馬政府宣布投資2億美元啟動“大數(shù)據研究和發(fā)展計劃”,這是繼1993年美國宣布“信息高速公路”計劃后的又一次重大科技發(fā)展部署。美國政府認為大數(shù)據是“未來的新石油”,將“大數(shù)據研究”上升為國家意志,這對未來的科技與經濟發(fā)展必將帶來深遠影響。大數(shù)據研究的熱潮激勵基礎研究的科研人員開始考慮“數(shù)據科學”問題。目前大數(shù)據的工程技術研究已走在科學研究的前面。美國政府6個部門啟動的大數(shù)據研究計劃中,國家科學基金會的研究內容提到要“形成一個包括數(shù)學、統(tǒng)計基礎和計算機算法的獨特學科”。圖靈獎得主吉姆·格雷描繪了數(shù)據密集型科研第四范式的愿景,將大數(shù)據科研從第三范式(計算機模擬)中分離出來單獨作為一種科研范式,是因為其研究方式不同于基于數(shù)學模型的傳統(tǒng)研究方式。大數(shù)據研究能成為一門科學的前提是,在一個領域發(fā)現(xiàn)的數(shù)據相互關系和規(guī)律具有可推廣到其他領域的普適性。提煉“大數(shù)據”的共性還需要一段時間的實踐積累才會逐步清晰明朗。將大量多元異構、交互性和時效性強并包含大量噪聲的數(shù)據作為研究對象的專門學科,依然具備了鮮明的學科特征。
3 大數(shù)據專業(yè)與其他相關專業(yè)的異質性分析
由于大數(shù)據專業(yè)主要支撐技術來源于信息技術,所以在專業(yè)申報中應將該專業(yè)所屬學科門類及專業(yè)類推薦設在計算機科學與技術學科下,大數(shù)據專業(yè)與計算機學科下所屬專業(yè)的關系及區(qū)分度可以概括如下幾點。
?。?)研究對象的側重點不同?!按髷?shù)據科學與應用”專業(yè)研究的核心對象是“大數(shù)據”,既不是硬件、軟件理論研究,也不是計算機技術在某個領域的應用研究或者某一特定計算機技術的理論和應用研究,并且“大數(shù)據”引發(fā)的研究不可能在短時間完成,“大數(shù)據”問題研究具備了跨行業(yè)、跨領域的普適性。除去該專業(yè)所需的計算機學科之外的專業(yè)知識,就計算機學科內部而言,該專業(yè)所需知識在計算機學科的其他專業(yè)都有涉及,但又不被完全包含,所以不便將其歸入現(xiàn)有專業(yè)之中。
?。?)大數(shù)據科學素養(yǎng)要求高。該專業(yè)對學生在“大數(shù)據科學素養(yǎng)”方面有更高的要求,在理論上,強調學生有很好的數(shù)理統(tǒng)計基礎、扎實的數(shù)據結構和算法的基本功,能夠很好地理解和掌握各種機器學習和數(shù)據挖掘算法;在實踐上,強調學生具備海量數(shù)據獲取、數(shù)據組織與存儲、數(shù)據清洗、數(shù)據預處理、數(shù)據分析以及數(shù)據可視化的工程實踐能力,掌握數(shù)據處理各個環(huán)節(jié)的基本技能;在理論與實踐結合方面,強調學生掌握處理“大數(shù)據”的先進技術和理論,即掌握與云計算相關的大數(shù)據處理平臺及其生態(tài)系統(tǒng),強調與數(shù)據來源緊密相關的新技術的融合與互動,即理解和掌握物聯(lián)網、移動互聯(lián)網相關理關理論和技術。
?。?)專業(yè)具備前所未有的復合性特征。對大數(shù)據而言,技術走在科學前面。目前的局面是各個學科(如生物、醫(yī)療、金融等)的科學家都以自己為主處理本領域的海量數(shù)據,各領域的科學問題還掌握在各學科的科學家手里。本專業(yè)的設置希望從一開始就以培養(yǎng)復合型人才為目標,以大數(shù)據為核心研究對象,強調學生對專業(yè)領域(經濟、金融、電子商務)數(shù)據的理解能力,深刻體現(xiàn)技術為數(shù)據服務的思想。
?。?)與統(tǒng)計學專業(yè)的區(qū)別。本專業(yè)與統(tǒng)計學專業(yè)的最大區(qū)別來自于對IT技術的理解和掌握,強調數(shù)據在獲取、清洗、存儲、處理和展示等各個環(huán)節(jié)與IT技術的深度融合,而不僅僅是將IT技術作為輔助手段;就數(shù)據處理的種類而言,更重視對非結構化和半結構化數(shù)據(統(tǒng)計學專業(yè)處理的數(shù)據一般為結構化數(shù)據)的處理。
?。?)與信息管理專業(yè)的區(qū)別。本專業(yè)與信息管理專業(yè)的區(qū)別主要體現(xiàn)在看待數(shù)據和信息的角度。信息管理主要強調在理解數(shù)據和業(yè)務流程的基礎上,通過科學的分析和設計方法,實現(xiàn)管理信息系統(tǒng),強調利用計算機技術介入、改造和升級原有的業(yè)務系統(tǒng)。“大數(shù)據”相關理論和技術更側重對數(shù)據本身的洞察與理解,相對而言更加獨立于原有的業(yè)務系統(tǒng),更專注對海量、復雜、多元數(shù)據的深度分析和處理能力,更依賴于大數(shù)據處理平臺和技術,也更好地支撐了物聯(lián)網、移動互聯(lián)網的應用和發(fā)展。
4 國內外大數(shù)據相關專業(yè)發(fā)展情況及就業(yè)前景分析
4.1大數(shù)據相關專業(yè)發(fā)展情況
由于市場對大數(shù)據人才的需求日益激烈,國外很多大學開始專門開設數(shù)據分析類專業(yè)。美國USNews排名Top50院校中的哈佛大學、哥倫比亞大學、斯坦福大學、芝加哥大學、麻省理工學院、卡內基梅隆大學等15所高校均開設了大數(shù)據相關專業(yè)。另外,由于大數(shù)據在2012—2013年開始興起,人才市場無法迅速培養(yǎng)出大量符合企業(yè)期望的人才,美國一些公司采取了更現(xiàn)實的做法:和大學合作,長期培養(yǎng)大數(shù)據專業(yè)人才以及開展相關研究,比如英特爾就和數(shù)據學專業(yè)排名靠前的麻省理工學院合作,建立了大數(shù)據科學技術中心。目前,國內大數(shù)據相關專業(yè)主要開設在研究生層次。2014年中國科學院大學開設首個“大數(shù)據技術與應用”專業(yè)方向,該專業(yè)面向科研發(fā)展及及產業(yè)實踐,培養(yǎng)信息技術與行業(yè)需求結合的復合型的大數(shù)據人才;2014年清華大學成立數(shù)據科學研究院,推出多學科交叉培養(yǎng)的大數(shù)據碩士項目;中國人民大學也設立了大數(shù)據應用與云管理、大數(shù)據與應用統(tǒng)計、大數(shù)據應用方向以及大數(shù)據與云計算研究方向;北京航空航天學院軟件學院開設了大數(shù)據和云計算研究方向,并已經有畢業(yè)生;另外,上海交通大學、浙江大學、天津大學、廈門大學等也在研究生層次建立大數(shù)據專業(yè)。許多高校同時也在籌建本科的大數(shù)據相關專業(yè),西安交通大學、北京交通大學等與IBM公司合作啟動了大數(shù)據本科專業(yè)的建設或者改造現(xiàn)有相關專業(yè)。針對當前中國市場急劇擴大的大數(shù)據與分析技能需求和人才缺口,IBM投入1億美元在中國大學推行大數(shù)據教育,并推出“IBMU-100”合作計劃,在100所高校設立大數(shù)據與分析技術中心,在其中30所高校開設本科和碩士課程,在5所大學設立“卓越中心”。
4.2復合型人才就業(yè)前景
Glassdoor公司2016年1月發(fā)布的“美國最好的工作”排名中,數(shù)據科學家位居第一,底薪為11.6萬美元。通過分析大數(shù)據人才市場需求、與大數(shù)據公司研討以及對業(yè)界的調研,我們認為對外經濟貿易大學開設大數(shù)據專業(yè)及就業(yè)方向主要有如下三個方面:
(1)貿易金融方向大數(shù)據分析師:主要就業(yè)崗位在供應鏈融資公司、P2P信貸征信平臺、商業(yè)銀行等。
(2)網絡營銷方向大數(shù)據分析師:主要就業(yè)崗位在互聯(lián)網廣告、O2O營銷公司、大型網絡媒體等。
?。?)物流與電子商務方向大數(shù)據分析師。主要就業(yè)崗位在電子商務公司、現(xiàn)代物流公司、第三方支付公司等。學生職業(yè)生涯成長目標為首席數(shù)據官(CDO),如圖1所示。
5 對外經濟貿易大學開設大數(shù)據分析專業(yè)的基礎及對大數(shù)據專業(yè)的認識
5.1財經學校背景優(yōu)勢
支撐大數(shù)據專業(yè)申報對外經濟貿易大學在經貿、金融、管理、法律等專業(yè)擁有得天獨厚的條件。秉承創(chuàng)新“商業(yè)大數(shù)據人才”的培養(yǎng)方略,建立適合財經類院校的商務大數(shù)據專業(yè),為國家產業(yè)轉型與行業(yè)發(fā)展需求貢獻合格的人才,支撐國家大數(shù)據戰(zhàn)略的實現(xiàn),是我們申報開設大數(shù)據專業(yè)的出發(fā)點。從社會發(fā)展需求出發(fā),建設以國際化、精品化、金融與商務相結合為特色的大數(shù)據專業(yè)是我們進行專業(yè)建設的指導思想。
5.2師資隊伍建設與儲備
大數(shù)據專業(yè)申報所依托的信息學院近年來引進了多名優(yōu)秀的具有海內外大數(shù)據分析背景的人才充實到教學科研隊伍中。師資隊伍多元化教育背景和工作經歷是學院的巨大財富,也為該專業(yè)的創(chuàng)建提供了先決條件。同時2014年信息學院先后兩次派教師參加大數(shù)據核心課程培訓,為新專業(yè)申報進行了專業(yè)師資的儲備。
5.3成立產學結合的大數(shù)據專業(yè)建設小組并開展專業(yè)研討
信息學院為建設大數(shù)據專業(yè),多次召開專業(yè)建設研討會,特別邀請承擔2015CCTV兩會大數(shù)據制作的專業(yè)大數(shù)據公司技術總監(jiān)來學院介紹大數(shù)據的采集、處理、展示等全過程;邀請新浪微博大數(shù)據中心建設人員就大數(shù)據專業(yè)人才需求、專業(yè)定位進行研討。組建了有大數(shù)據企業(yè)參加的專業(yè)申報籌備小組,億贊普大數(shù)據公司技術總監(jiān)作為專業(yè)建設成員參與專業(yè)建設和課程體系設計與實施。
5.4與大數(shù)據企業(yè)和大數(shù)據產業(yè)協(xié)會聯(lián)系緊密
信息學院大數(shù)據專業(yè)籌備組成員與中國信息化協(xié)會大數(shù)據分會、一線大數(shù)據聯(lián)盟、中國大數(shù)據產業(yè)規(guī)劃聯(lián)盟、中國物流大數(shù)據產業(yè)合作聯(lián)盟等產業(yè)協(xié)會建立了緊密的合作關系;與91金融超市建立了科學研究和實習基地;與京翰數(shù)據技術公司就物流大數(shù)據研發(fā)建立并簽署了科研合作協(xié)議;2015年與京東物流大數(shù)據創(chuàng)新部進行合作接洽。
5.5人才培養(yǎng)方案及實踐教學環(huán)境建設
目前大數(shù)據人才培養(yǎng)方案還處于探索階段,鑒于大數(shù)據是一個交叉專業(yè),業(yè)界的共識是在計算機科學技術相關專業(yè)基礎上融合機器學習、數(shù)據挖掘的數(shù)據分析技術。針對業(yè)界共識與對外經濟貿易大學學科背景實際,我們設計了具有對外經濟貿易大學特色的人才培養(yǎng)方案,其主線是“大數(shù)據分析+信息技術+經濟貿易應用”。大數(shù)據是應用性、實踐性很強的專業(yè),信息學院擁有國家級實驗教學示范中心,為大數(shù)據人才培養(yǎng)提供了可行的實踐教學環(huán)境。
5.6對大數(shù)據專業(yè)的認識
IBM公司賦予大數(shù)據“領悟數(shù)據,提升見識,洞察秋毫,驅動優(yōu)化”四個內涵,這也構成了本專業(yè)的基本特點:側重于大數(shù)據技術的應用,強調大數(shù)據間相關性的發(fā)現(xiàn),其核心能力是“大數(shù)據中的價值發(fā)現(xiàn)和應用”?!按髷?shù)據科學與應用”專業(yè)設置具有顯著的跨學科特點,學生不僅要掌握統(tǒng)計學、計算機科學、信息管理等專業(yè)的基礎知識,還要具備其他專業(yè)領域較深的知識背景(如經濟貿易或金融專業(yè)領域知識),最重要的是要有依托數(shù)據創(chuàng)造價值的能力。在專業(yè)籌備和申報過程中,我們認為大數(shù)據專業(yè)的技術核心應圍繞大數(shù)據采集、組織與存儲、分析與處理、結果呈現(xiàn)而進行,而大數(shù)據的數(shù)據源及內容應該來源于經濟貿易、金融交易、物流與電子商務等商務與管理應用領域。所以我們將該專業(yè)的培養(yǎng)目標界定為:旨在培養(yǎng)具備大數(shù)據科學素養(yǎng),掌握經濟管理、網絡金融、電子商務等領域知識的專業(yè)人才,為以大數(shù)據技術為支撐的相關行業(yè)培養(yǎng)國際化、復合型的高素質人才;人才要具備將領域知識與計算機技術和大數(shù)據技術融合、創(chuàng)新的能力,能夠從數(shù)據工程的視角從事經濟、金融、電子商務等領域的大數(shù)據采集、組織、管理、分析以及應用的工作。
6 結語
時代發(fā)展呼吁建立大數(shù)據專業(yè)人才培養(yǎng)體系,對外經濟貿易大學“大數(shù)據科學與技術”專業(yè)申報經歷了通訊評審、網上公示、專家委員會會審等系列程序。教育部學科發(fā)展與專業(yè)設置專家委員會評議后建議將專業(yè)名稱統(tǒng)一規(guī)范為“數(shù)據科學與大數(shù)據技術”。我們認為這樣更能體現(xiàn)工學學士學位特征。專業(yè)申報只是我們邁出的第一步,建設有對外經濟貿易大學特色的大數(shù)據專業(yè),培養(yǎng)受社會歡迎的、高質量的大數(shù)據人才,我們深感任重而道遠。
數(shù)據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓練與驗證損失驟升:機器學習訓練中的異常診斷與解決方案 在機器學習模型訓練過程中,“損失曲線” 是反映模型學習狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉型加速的今天,企業(yè)對數(shù)據的需求已從 “存儲” 轉向 “ ...
2025-09-19CDA 數(shù)據分析師:讓統(tǒng)計基本概念成為業(yè)務決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據分析的 “基礎語言”—— 從描述數(shù)據分布的 “均 ...
2025-09-19CDA 數(shù)據分析師:表結構數(shù)據 “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(如數(shù)據庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據分析師:解鎖表結構數(shù)據特征價值的專業(yè)核心 表結構數(shù)據(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據,如數(shù)據庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據差異是否 “ ...
2025-09-16CDA 數(shù)據分析師:掌控表格結構數(shù)據全功能周期的專業(yè)操盤手 表格結構數(shù)據(以 “行 - 列” 存儲的結構化數(shù)據,如 Excel 表、數(shù)據 ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據分析師:激活表格結構數(shù)據價值的核心操盤手 表格結構數(shù)據(如 Excel 表格、數(shù)據庫表)是企業(yè)最基礎、最核心的數(shù)據形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數(shù)據爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據的科學計數(shù)法問題 為幫助 Python 數(shù)據從業(yè)者解決pd.read_csv讀取長浮點數(shù)據時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據分析師:業(yè)務數(shù)據分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11