
來源 | 21世紀經(jīng)濟報道
中國科學院院士、中國人民解放軍軍事科學院副院長梅宏認為,當前大數(shù)據(jù)應用尚處于初級階段,根據(jù)大數(shù)據(jù)分析預測未來、指導實踐的深層次應用將成為發(fā)展重點。
他指出,預計到2020年,我國數(shù)據(jù)總量有望占全球數(shù)據(jù)總量的21%,但我國核心技術薄弱,建議以開源為基礎構建自主可控的大數(shù)據(jù)產(chǎn)業(yè)生態(tài)。
大數(shù)據(jù)應用三個層次
梅宏指出,按照數(shù)據(jù)開發(fā)應用深入程度的不同,可將眾多的大數(shù)據(jù)應用分為三個層次。
第一層,描述性分析應用,是指從大數(shù)據(jù)中總結、抽取相關的信息和知識,幫助人們分析發(fā)生了什么,并呈現(xiàn)事物的發(fā)展歷程。
如美國的DOMO公司從其企業(yè)客戶的各個信息系統(tǒng)中抽取、整合數(shù)據(jù),再以統(tǒng)計圖表等可視化形式,將數(shù)據(jù)蘊含的信息推送給不同崗位的業(yè)務人員和管理者,幫助其更好地了解企業(yè)現(xiàn)狀,進而做出判斷和決策。
第二層,預測性分析應用,是指從大數(shù)據(jù)中分析事物之間的關聯(lián)關系、發(fā)展模式等,并據(jù)此對事物發(fā)展的趨勢進行預測。
如微軟公司紐約研究院研究員David Rothschild通過收集和分析賭博市場、好萊塢證券交易所、社交媒體用戶發(fā)布的帖子等大量公開數(shù)據(jù),建立預測模型,對多屆奧斯卡獎項的歸屬進行預測。2014和2015年,均準確預測了奧斯卡共24個獎項中的21個,準確率達87.5%。
第三層,指導性分析應用,是指在前兩個層次的基礎上,分析不同決策將導致的后果,并對決策進行指導和優(yōu)化。
如無人駕駛汽車分析高精度地圖數(shù)據(jù)和海量的激光雷達、攝像頭等傳感器的實時感知數(shù)據(jù),對車輛不同駕駛行為的后果進行預判,并據(jù)此指導車輛的自動駕駛。
自動駕駛有效應用面臨挑戰(zhàn)
梅宏認為,當前,在大數(shù)據(jù)應用的實踐中,描述性、預測性分析應用多,決策指導性等更深層次分析應用偏少。
一般而言,人們做出決策的流程通常包括:認知現(xiàn)狀、預測未來和選擇策略這三個基本步驟。這些步驟也對應了上述大數(shù)據(jù)分析應用的三個不同類型。
不同類型的應用意味著人類和計算機在決策流程中不同的分工和協(xié)作。例如:第一層次的描述性分析中,計算機僅負責將與現(xiàn)狀相關的信息和知識展現(xiàn)給人類專家,而對未來態(tài)勢的判斷及對最優(yōu)策略的選擇仍然由人類專家完成。應用層次越深,計算機承擔的任務越多、越復雜,效率提升也越大,價值也越大。
然而,隨著研究應用的不斷深入,人們逐漸意識到前期在大數(shù)據(jù)分析應用中大放異彩的深度神經(jīng)網(wǎng)絡尚存在基礎理論不完善、模型不具可解釋性、魯棒性較差等問題。
因此,雖然應用層次最深的決策指導性應用,當前已在人機博弈等非關鍵性領域取得較好應用效果,但是,在自動駕駛、政府決策、軍事指揮、醫(yī)療健康等應用價值更高,且與人類生命、財產(chǎn)、發(fā)展和安全緊密關聯(lián)的領域,要真正獲得有效應用,仍面臨一系列待解決的重大基礎理論和核心技術挑戰(zhàn)。
梅宏指出,在此之前,人們還不敢、也不能放手將更多的任務交由計算機大數(shù)據(jù)分析系統(tǒng)來完成。這也意味著,雖然已有很多成功的大數(shù)據(jù)應用案例,但還遠未達到我們的預期,大數(shù)據(jù)應用仍處于初級階段。
未來,隨著應用領域的拓展、技術的提升、數(shù)據(jù)共享開放機制的完善,以及產(chǎn)業(yè)生態(tài)的成熟,具有更大潛在價值的預測性和指導性應用將是發(fā)展的重點。
工業(yè)互聯(lián)網(wǎng)政府熱、企業(yè)冷
作為人口大國和制造大國,我國數(shù)據(jù)產(chǎn)生能力巨大,大數(shù)據(jù)資源極為豐富。
梅宏指出,預計到2020年,我國數(shù)據(jù)總量有望達到8000EB(1018),占全球數(shù)據(jù)總量的21%,將成為名列前茅的數(shù)據(jù)資源大國和全球數(shù)據(jù)中心。
然而,我們也必須清醒地認識到我國在大數(shù)據(jù)方面仍存在一系列亟待補上的短板。
其中較為突出的是核心技術薄弱,基礎理論與核心技術的落后導致我國信息技術長期存在“空心化”和“低端化”問題,大數(shù)據(jù)時代需避免此問題在新一輪發(fā)展中再次出現(xiàn)。
近年來,我國在大數(shù)據(jù)應用領域取得較大進展,但是基礎理論、核心器件和算法、軟件等層面,較之美國等技術發(fā)達國家仍明顯落后。
在大數(shù)據(jù)管理、處理系統(tǒng)與工具方面,我國主要依賴國外開源社區(qū)的開源軟件,然而,由于我國對國際開源社區(qū)的影響力較弱,導致對大數(shù)據(jù)技術生態(tài)缺乏自主可控能力,成為制約我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展和國際化運營的重大隱患。
梅宏建議采用“參與融入、蓄勢引領”的開源推進策略,一方面鼓勵我國企業(yè)積極“參與融入”國際成熟的開源社區(qū),爭取話語權;另一方面,也要在建設基于中文的開源社區(qū)方面加大投入,匯聚國內(nèi)軟硬件資源和開源人才,打造自主可控開源生態(tài),在學習實踐中逐漸成長壯大,伺機實現(xiàn)引領發(fā)展。
此外,融合應用有待深化。梅宏指出我國大數(shù)據(jù)與實體經(jīng)濟融合不夠深入,主要問題表現(xiàn)在:基礎設施配置不到位,數(shù)據(jù)采集難度大;缺乏有效引導與支撐,實體經(jīng)濟數(shù)字化轉型緩慢;缺乏自主可控的數(shù)據(jù)互聯(lián)共享平臺等。
當前,工業(yè)互聯(lián)網(wǎng)成為互聯(lián)網(wǎng)發(fā)展的新領域,然而仍存在不少問題:政府熱、企業(yè)冷,政府時有“項目式”、“運動式”推進,而企業(yè)由于沒看到直接、快捷的好處,接受度低;設備設施的數(shù)字化率和聯(lián)網(wǎng)率偏低;大多數(shù)大企業(yè)仍然傾向打造難以與外部系統(tǒng)交互數(shù)據(jù)的封閉系統(tǒng),而眾多中小企業(yè)數(shù)字化轉型的動力和能力嚴重不足;國外廠商的設備在我國具有壟斷地位,這些企業(yè)紛紛推出相應的工業(yè)互聯(lián)網(wǎng)平臺,搶占工業(yè)領域的大數(shù)據(jù)基礎服務市場。
梅宏建議大力發(fā)展行業(yè)大數(shù)據(jù)應用。以制造業(yè)為例,麥肯錫研究報告稱:制造企業(yè)在利用大數(shù)據(jù)技術后,其生產(chǎn)成本能夠降低10%—15%。
而大數(shù)據(jù)技術對制造業(yè)的影響遠非成本這一個方面。利用源于產(chǎn)品生命周期中市場、設計、制造、服務、再利用等各個環(huán)節(jié)數(shù)據(jù),制造業(yè)企業(yè)可以更加精細、個性化地了解客戶需求;建立更加精益化、柔性化、智能化的生產(chǎn)系統(tǒng);創(chuàng)造包括銷售產(chǎn)品、服務、價值等多樣的商業(yè)模式;并實現(xiàn)從應激式到預防式的工業(yè)系統(tǒng)運轉管理模式的轉變。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經(jīng)網(wǎng)絡(RNN)家族中,長短期記憶網(wǎng)絡(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉日期:解鎖數(shù)據(jù)處理的關鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎 ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03