
從大數(shù)據(jù)走向大知識 大數(shù)據(jù)可以產(chǎn)生更多功能
大數(shù)據(jù)正在為人們的生活提供種種便利,關(guān)于大數(shù)據(jù)的討論已經(jīng)滲透經(jīng)濟(jì)、社會、生活各個領(lǐng)域,工程師們發(fā)現(xiàn)一個驚人的現(xiàn)實:大數(shù)據(jù)已經(jīng)開始獨立于人,在人類社會加自然界的二元空間之外,形成單獨的信息空間。
在近日于北京舉辦的數(shù)字化知識服務(wù)科學(xué)與工程2015國際高端研討會上,中國工程院院士潘云鶴表示:“50年以前人類還是二元空間,信息還依靠人來發(fā)出,信息來自于人類社會。人們寫書、開會交流、使用媒體,計算機的信息都是人輸進(jìn)去的。后來人們開始把信息進(jìn)行互聯(lián),有了互聯(lián)網(wǎng)、移動通信和搜索技術(shù),信息通過互聯(lián)網(wǎng)來自于物理世界,去年相關(guān)調(diào)查發(fā)現(xiàn),絕大部分網(wǎng)絡(luò)上信息的流量不是被人所占用,而是被機器人所占用,這是非常令人驚訝的。”
大數(shù)據(jù)時代真的主打“數(shù)據(jù)”嗎?許多國家開始著手對“數(shù)據(jù)”做文章。2001年中國政府和美國自然科學(xué)基金開始進(jìn)入一項國際合作項目:數(shù)字圖書館,讓所有人不論何時何地都能通過互聯(lián)網(wǎng)訪問到全人類的知識,這個項目一共實現(xiàn)了250萬冊圖書的數(shù)字化。
“雖然項目一開始是為了向全世界提供圖書和資料,但是后來發(fā)現(xiàn)不但可以借書,還可以有很多新的服務(wù),比如,可以實現(xiàn)在網(wǎng)上訪問名勝古跡,里面有敦煌石窟數(shù)字化三維造型。再比如,該項目把中國900多個書法家4000多件作品進(jìn)行了數(shù)字化,因此可以幫助全世界學(xué)習(xí)漢語和書法的人練習(xí)書法,也可以進(jìn)行書法的設(shè)計?!迸嗽弃Q說,“我們發(fā)現(xiàn)海量數(shù)據(jù)如果能彼此打通,從中可以產(chǎn)生大量新知識,我們把彼此聯(lián)通的海量知識稱為數(shù)據(jù)海,圖書館如果擁有數(shù)據(jù)海的話就可能發(fā)展成為數(shù)字圖書館,就和原有的圖書館具有完全不同的性能”。
因此,大數(shù)據(jù)時代不是只主打一組組的數(shù)據(jù),這些數(shù)據(jù)可以產(chǎn)生更多的功能,僅僅挖掘大數(shù)據(jù)是不夠的,應(yīng)該從大數(shù)據(jù)走向大知識。
在研討會上,記者了解到浙江大學(xué)正在將中醫(yī)大數(shù)據(jù)變?yōu)樾碌闹R。他們把各種各樣的方劑、疾病、醫(yī)生、病人互相打通,將互聯(lián)網(wǎng)、數(shù)字圖書館、專業(yè)數(shù)據(jù)聯(lián)系起來,進(jìn)行深度搜索。這樣一來,既可以研究中藥里某種化合物的成分,還可以對藥材進(jìn)行各種各樣的鑒別,對藥材如何組合進(jìn)行分析,這對于醫(yī)生探索新的藥方有非常大的幫助。
正是基于大數(shù)據(jù)到大知識的探索,中國工程院在2014年成立了國際工程科技知識中心,希望把多個數(shù)字圖書館、專業(yè)數(shù)據(jù)庫和世界上各種各樣跟工程科技有關(guān)的網(wǎng)站連在一起,讓大量的數(shù)據(jù)形成數(shù)據(jù)海,用數(shù)據(jù)海的特點從不同角度獲得新的知識和新的認(rèn)識。
潘云鶴說:“國際工程科技知識中心將為各個院士提供研究我國戰(zhàn)略所需要的知識,中心發(fā)展到一定程度后向全體工程師們開放,讓我國的工程師利用其開發(fā)新的產(chǎn)品,了解全世界在該領(lǐng)域的研究進(jìn)程。此外,這個中心還要承擔(dān)支持我國的產(chǎn)業(yè)轉(zhuǎn)型的重任。”
中國工程院院長周濟(jì)在研討會上表示,大數(shù)據(jù)與智能終端、移動互聯(lián)等相互結(jié)合,進(jìn)一步推動了信息化和工業(yè)化的深度融合,進(jìn)一步開拓了技術(shù)創(chuàng)新與經(jīng)濟(jì)發(fā)展的模式,進(jìn)一步提升了政治統(tǒng)領(lǐng)和行業(yè)發(fā)展的決策科學(xué)化水平,我們正在經(jīng)歷新一輪以大數(shù)據(jù)為主的信息革命和產(chǎn)業(yè)變革。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗證損失驟升:機器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11