
大科學(xué)工程,是以工程方式、 計(jì)劃手段、匯聚科技資源與力量整體推進(jìn)重大科技計(jì)劃的最新范式,是科學(xué)研究由傳統(tǒng)的“手工小作坊”向現(xiàn)代大規(guī)?!肮?chǎng)”演進(jìn)的一次革命。大科學(xué)范式的“兵 團(tuán)作戰(zhàn)”,將以空域和領(lǐng)域維度上的大規(guī)模,甚至超越時(shí)域維度上的長(zhǎng)尺度,實(shí)現(xiàn)今朝一日、史上數(shù)年的突破。
大科學(xué)是大數(shù)據(jù)的搖籃,大數(shù)據(jù)是大科學(xué)的產(chǎn)物
大科學(xué)的王者之道始于大數(shù)據(jù)的產(chǎn)生。人類歷史上的大數(shù)據(jù),源于科技領(lǐng)域,確切地說源于大科學(xué)研究。曼哈頓計(jì)劃打開了微觀世界,并開創(chuàng)了借用人造 的大科學(xué)設(shè)施洞開微觀世界的嶄新科學(xué)方法論,以此為依托啟動(dòng)了一系列大科學(xué)計(jì)劃,它們產(chǎn)生了史無前例的超大規(guī)模數(shù)據(jù)。如位于瑞士的歐洲核子研究中心、由全 球逾8000位物理學(xué)家合作興建的大型強(qiáng)子對(duì)撞機(jī),2008年試運(yùn)行后,數(shù)據(jù)量即達(dá)25PB/年,2020年建成后將達(dá)200PB/年,因此他們率先創(chuàng)建 了“大數(shù)據(jù)”的概念。無獨(dú)有偶,旨在測(cè)定人類基因組30億堿基遺傳密碼的基因組計(jì)劃,進(jìn)行個(gè)體基因組測(cè)定時(shí)數(shù)據(jù)量即已高達(dá)13PB/年。而此計(jì)劃后,學(xué)界 受其鼓舞開展了一系列遺傳背景迥異、不同疾病群體以及大量其他物種的基因組測(cè)序,數(shù)據(jù)量迅速逼近ZB級(jí)(是PB的百萬倍),不約而同地創(chuàng)造了“大數(shù)據(jù)”概念。今天人們常用的互聯(lián)網(wǎng)最初就是這些領(lǐng)域的科學(xué)家為解決海量數(shù)據(jù)傳輸而發(fā)明的。
人類理性對(duì)物質(zhì)世界、人類社會(huì)和精神世界的認(rèn)識(shí),其最高境界是智慧。而要達(dá)此境界必然經(jīng)過數(shù)據(jù)、信息、知識(shí)三個(gè)層階,其中,數(shù)據(jù)是信息之母、知 識(shí)之初、智慧之源。隨著信息技術(shù)持續(xù)數(shù)十年的迅猛發(fā)展以及人類社會(huì)各行各業(yè)信息化的強(qiáng)力輻射,在人類紀(jì)元新千年的鐘聲敲響不久,文明世界就掀起了史無前例 的大數(shù)據(jù)狂潮,其奔涌之疾,升騰之烈,不似海嘯,勝似海嘯。人們歡呼,因?yàn)樗谴菘堇?、一往無前的狂飆,將以勢(shì)不可擋的革命性力量,開辟新的天地;人們 恐懼,因?yàn)樗切胁挥身\、漫無方向的野馬,有著難以預(yù)想的破壞性力量。此時(shí)此刻,人類需要冷靜,人類必須理性。
人類文明迄今經(jīng)歷了三次浪潮:第一次是農(nóng)業(yè)革命,數(shù)千年前出現(xiàn)并持續(xù)數(shù)千年,釋放出“物之力”;第二次是工業(yè)革命,數(shù)百年前出現(xiàn)并已持續(xù)數(shù)百 年,釋放出“能之力”;第三次是智業(yè)革命,數(shù)十年前開始孕育,目前正處初級(jí)階段,將不斷釋放“智之力”。1980年,托夫勒預(yù)言了這次新起的文明,并明確 指出這次文明將以信息化為標(biāo)志。其后,恰如其料,技術(shù)與文明的信息化有如神助,在人類社會(huì)各領(lǐng)域、全球各地域甚至更廣闊的空域天域似地火一般的點(diǎn)燃、普 及。信息社會(huì)、信息文明似乎轉(zhuǎn)眼間唾手即得,更有大數(shù)據(jù)時(shí)代的 “即時(shí)”到來好像為此作了一目了然的注解。冷靜分析,實(shí)則不然。數(shù)據(jù)是信息之母,沒有數(shù)據(jù),何來信息?缺乏數(shù)據(jù)的時(shí)代,怎能是名副其實(shí)的信息時(shí)代?而剛剛 才來的大數(shù)據(jù)時(shí)代,恰恰表明此前是數(shù)據(jù)欠缺的“時(shí)代”。此前,人類發(fā)現(xiàn)、開辟的大量全新的數(shù)據(jù)空間,構(gòu)建的超大型數(shù)據(jù)生產(chǎn)“工廠”、超大型數(shù)據(jù)倉(cāng)庫(kù),建設(shè) 的“信息高速公路”及其四通八達(dá)的網(wǎng)絡(luò),為大數(shù)據(jù)的涌現(xiàn)及其廣泛輻射確實(shí)提供了充分的先決條件,但它們僅是大數(shù)據(jù)的搖籃,而不是搖籃里的嬰兒。
從大數(shù)據(jù)向大信息升華,亟待統(tǒng)計(jì)科學(xué)與數(shù)據(jù)科學(xué)的革新
數(shù)據(jù)是信息之母,但再好的數(shù)據(jù)也不會(huì)自動(dòng)生成信息。大數(shù)據(jù)得來不易,但轉(zhuǎn)化為大信息更難,而不能轉(zhuǎn)化為大信息的大數(shù)據(jù)就是橫亙于人類認(rèn)知之旅的理性黑洞、知性沙漠。實(shí)際上,人類理性跨過蒙昧之初,就擁有了將數(shù)據(jù)轉(zhuǎn)換為信息的能力,這也是智人與直立人的分水嶺。
然而,面對(duì)時(shí)下大數(shù)據(jù)時(shí)代奔涌的多元、多源、異構(gòu)的海量數(shù)據(jù),無論是被美譽(yù)為“孕育了現(xiàn)代科學(xué)”的統(tǒng)計(jì)科學(xué),還是應(yīng)大科學(xué)之運(yùn)而生、當(dāng)今正如日中天的數(shù)據(jù)科學(xué),都還只能是望洋興嘆。今日之大數(shù)據(jù),明日之大信息,扭轉(zhuǎn)乾坤者,還屬革新后的統(tǒng)計(jì)科學(xué)與數(shù)據(jù)科學(xué)。
信息雖然衍進(jìn)自數(shù)據(jù)、珍貴于數(shù)據(jù),但也只是其通向知識(shí)的中繼站。知識(shí),是人類理性認(rèn)識(shí)世界的結(jié)晶,是改造世界的基石。培根在《偉大的復(fù)興》中豪 邁地預(yù)言:知識(shí)就是力量。大約400年后,人類終于迎來“知識(shí)經(jīng)濟(jì)時(shí)代”。知識(shí)經(jīng)濟(jì),作為人類社會(huì)經(jīng)濟(jì)增長(zhǎng)方式與經(jīng)濟(jì)發(fā)展的全新模式,被稱為經(jīng)濟(jì)領(lǐng)域的哥 白尼革命,其基本特征是:知識(shí)運(yùn)營(yíng)為經(jīng)濟(jì)增長(zhǎng)方式、知識(shí)產(chǎn)業(yè)成為龍頭產(chǎn)業(yè)、知識(shí)經(jīng)濟(jì)成為新的最活躍的經(jīng)濟(jì)形態(tài)。
由此可見,知識(shí)不僅是力量,而且是時(shí)代最核心、最強(qiáng)勁的先鋒力量。但我們同時(shí)必須清醒地認(rèn)識(shí)到:大數(shù)據(jù)與大知識(shí),尚隔兩重天,如將大數(shù)據(jù)比作洪 水、比作奔流,它只有首先蒸發(fā)為大信息的氣流,繼而升騰為大知識(shí)的彩虹,才能氣貫長(zhǎng)虹、一飛沖天而成為引領(lǐng)知識(shí)經(jīng)濟(jì)時(shí)代的“巨龍”。
2015年大數(shù)據(jù)發(fā)展十大預(yù)測(cè)
1.結(jié)合智能計(jì)算的大數(shù)據(jù)分析成為熱點(diǎn),包括大數(shù)據(jù)與神經(jīng)計(jì)算、深度學(xué)習(xí)、語義計(jì)算以及人工智能其他相關(guān)技術(shù)結(jié)合,成為大數(shù)據(jù)分析領(lǐng)域的熱點(diǎn)。
2.數(shù)據(jù)科學(xué)帶動(dòng)多學(xué)科融合,但是數(shù)據(jù)科學(xué)作為新興的學(xué)科,其學(xué)科基礎(chǔ)問題體系尚不明朗,數(shù)據(jù)科學(xué)自身的發(fā)展尚未成體系。
3.跨學(xué)科領(lǐng)域交叉的數(shù)據(jù)融合分析與應(yīng)用將成為今后大數(shù)據(jù)分析應(yīng)用發(fā)展的重大趨勢(shì)。
4.大數(shù)據(jù)將與物聯(lián)網(wǎng)、移動(dòng)互聯(lián)、云計(jì)算、社會(huì)計(jì)算等熱點(diǎn)技術(shù)領(lǐng)域相互交叉融合,產(chǎn)生很多綜合性應(yīng)用。
5.大數(shù)據(jù)多樣化處理模式與軟硬件基礎(chǔ)設(shè)施逐步夯實(shí)。
6.大數(shù)據(jù)安全和隱私。
7.新的計(jì)算模式將取得突破。
8.各種可視化技術(shù)和工具提升大數(shù)據(jù)分析。
9.大數(shù)據(jù)技術(shù)課程體系建設(shè)和人才培養(yǎng)。
10.開源系統(tǒng)將成為大數(shù)據(jù)領(lǐng)域的主流技術(shù)和系統(tǒng)選擇。
?。ㄙY料來源:中國(guó)大數(shù)據(jù)技術(shù)大會(huì)發(fā)布的《2015大數(shù)據(jù)十大發(fā)展趨勢(shì)預(yù)測(cè)》)
生命組學(xué)必將成為開啟大發(fā)現(xiàn)新時(shí)代的領(lǐng)航者
畢達(dá)哥拉斯學(xué)派開啟了科學(xué)的第一個(gè)大發(fā)現(xiàn)時(shí)代。他們集中證明:算術(shù)的本質(zhì)是“絕對(duì)的不連續(xù)量”,音樂的本質(zhì)是“相對(duì)的不連續(xù)量”,幾何的本質(zhì)是“靜止的連續(xù)量”,天文學(xué)的本質(zhì)是“運(yùn)動(dòng)的連續(xù)量”,終成“數(shù)即萬物”學(xué)說。
基于第谷終身積累的海量數(shù)據(jù),開普勒實(shí)現(xiàn)了對(duì)太陽系幾乎所有天體運(yùn)動(dòng)規(guī)律的高度理論概括,因而被譽(yù)為“天空立法者”。同時(shí)期,伽利略亦通過大量 觀測(cè),先后發(fā)現(xiàn)了運(yùn)動(dòng)的第一(勻速)、第二(勻加速)定律,被冠以“近代實(shí)驗(yàn)科學(xué)精神的創(chuàng)造者”。而開普勒、伽利略等的系列大發(fā)現(xiàn),迅即催生了牛頓的集大 成時(shí)代。一時(shí)間,牛頓力學(xué)統(tǒng)一了聲學(xué)、光學(xué)、電磁學(xué)和熱學(xué),“萬有”的牛頓定律幾乎支配著小到超顯微粒子、大到宇宙天體的整個(gè)物質(zhì)世界。
20世紀(jì)是基因的大發(fā)現(xiàn)時(shí)代。1900年,孟德爾遺傳定律重新發(fā)現(xiàn);1910年,基因連鎖定律發(fā)現(xiàn);1944年證明遺傳物質(zhì)為DNA;1952 年,DNA堿基組成定律發(fā)現(xiàn);1953年DNA雙螺旋模型問世,它洞開了萬古遺傳之謎及其遺傳密碼,進(jìn)而揭示了統(tǒng)一萬千生命世界的中心法則,并為人類基因 組計(jì)劃提供了理論與技術(shù)基礎(chǔ)。
大科學(xué)研究,不僅開啟了大數(shù)據(jù)時(shí)代,而且也光大了大發(fā)現(xiàn)時(shí)代。例如,人們通過大型強(qiáng)子對(duì)撞機(jī),在不到5年的時(shí)間里,就實(shí)現(xiàn)了對(duì)“上帝粒子”(希格斯玻色子) 的重大發(fā)現(xiàn)。希格斯玻色子的存在是最新一代大一統(tǒng)理論即“標(biāo)準(zhǔn)模型”的預(yù)言,而此模型是統(tǒng)一描述宇宙強(qiáng)力、弱力和電磁力這三種基本力及組成所有物質(zhì)的基本 粒子的理論,從而揭示了基本粒子為何擁有質(zhì)量并演化為萬事萬物的“至理大道”,向人類破解宇宙誕生之謎邁進(jìn)了一大步,因此在其發(fā)現(xiàn)的第二年,預(yù)言者即被授 予諾貝爾獎(jiǎng)。而此驚天大發(fā)現(xiàn)出自大設(shè)施、源于大科學(xué)、成于大數(shù)據(jù)、歸于大智慧。它們預(yù)示著人類社會(huì)正在走向集大成的最偉大時(shí)代——智慧時(shí)代。正如莎士比亞 所言:凡是過去,皆為序曲。人類的前程又到了一個(gè)新的轉(zhuǎn)折點(diǎn)。
“人腦是自然界最復(fù)雜的系統(tǒng),認(rèn)知、意識(shí)、情感產(chǎn)生機(jī)理是自然科學(xué)的終極疆域,解讀人腦成為國(guó)際科技競(jìng)爭(zhēng)的巔峰戰(zhàn)場(chǎng)”。2013年以來,集大科學(xué)、大數(shù)據(jù)、大發(fā)現(xiàn)之大成的“人類腦計(jì)劃”相繼在歐洲、北美洲、亞洲依次展開。就像曼哈頓計(jì)劃、阿波羅計(jì)劃開啟了知識(shí)經(jīng)濟(jì)、信息社會(huì)、大數(shù)據(jù)時(shí)代一樣,人類基因組、蛋白質(zhì)組計(jì)劃、腦計(jì)劃正開啟集大成的最偉大時(shí)代——智慧時(shí)代!
(作者為軍事醫(yī)學(xué)科學(xué)院院長(zhǎng)、中國(guó)科學(xué)院院士)
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03