
互聯(lián)網(wǎng)最尖端的競爭集中在大數(shù)據(jù)
2015中關村大數(shù)據(jù)日的峰會上,中國科學院院士張平文舉了一個有趣例子:前一陣,他有家人甲狀腺不適,院士有天晚上查了甲狀腺知識,第二天就收到微信好友申請,有專治甲狀腺的醫(yī)生想加他為好友,院士感概說,“沒有人懷疑我們就生活在大數(shù)據(jù)時代,”
2015年以來,從“大眾創(chuàng)業(yè)、萬眾創(chuàng)新”,一直到“互聯(lián)網(wǎng)+”以及大數(shù)據(jù)發(fā)展行動綱要,國家利好政策不斷,行業(yè)領軍者開拓創(chuàng)新,中國大數(shù)據(jù)產(chǎn)業(yè)群正快速形成,大數(shù)據(jù)在交通、工業(yè)、社交等領域的應用也日新月異。大數(shù)據(jù),正在開啟一個認知的新時代,這是一座新的商業(yè)寶藏,也正醞釀著一場全新的較量。
“最尖端的競爭”
過去3年,打車應用真正改變了大眾出行,滴滴快的CEO程維在大數(shù)據(jù)日峰會分享說,“中國80%的出租車司機通過滴滴連接在一起,又順勢推出了滴滴專車、快車、順風車、巴士等系列新業(yè)務,希望將有相同出行需求的人連接在一起,實現(xiàn)任何人在任何時間、任何地點在3分鐘內(nèi)叫到一輛車?!?/span>
美好的愿景完全依賴于大數(shù)據(jù)的支持。直到現(xiàn)在,程維依然清晰地記得一宗“事故”:2013年有一次北京大雨,CBD國貿(mào)地區(qū)用戶打不到車,滴滴技術團隊梳理訂單后發(fā)現(xiàn),絕大多數(shù)的訂單根本發(fā)不出去,“我們最初德爾大數(shù)據(jù)算法是將一個訂單發(fā)給附近1-3公里的司機,在訂單非常多的時候,司機信道變成稀缺資源,就無法接到更多的訂單。”
程維很快發(fā)現(xiàn),當一個城市日均訂單超過1萬單后,原始的大數(shù)據(jù)算法即成為瓶頸,于是,滴滴將建設中國最好的大數(shù)據(jù)團隊當成公司戰(zhàn)略,為實現(xiàn)用戶和司機的快速匹配,迄今后臺已經(jīng)多個版本的大數(shù)據(jù)結(jié)構和算法。
大數(shù)據(jù)在交通的應用,并不限于打車。構建了完整大數(shù)據(jù)產(chǎn)業(yè)平臺的北京久其軟件公司,曾為江蘇省提供智能化交通統(tǒng)計監(jiān)測系統(tǒng),將所有江蘇省內(nèi)高速出入口的視頻以及海運、河運、港口等所有的音視頻的數(shù)據(jù)全部納入體系,進行實時監(jiān)控。久其軟件副總裁錢暉分享說,“在江蘇省內(nèi),如果你的車被偷或者號牌模糊,系統(tǒng)在一秒鐘之內(nèi)就能實現(xiàn)號牌識別。”
錢暉表示,智慧交通系統(tǒng)積累的數(shù)據(jù),服務范圍不限于交通,比如經(jīng)濟學有所謂“克強指數(shù)”(即以工業(yè)用電量新增、鐵路貨運量新增和銀行中長期貸款新增的數(shù)據(jù),評判GDP的增長),利用智能系統(tǒng)可以監(jiān)測高速公路出入口大貨車的運量,分析實體經(jīng)濟狀況,用于經(jīng)濟決策。
提供便利的同時,大數(shù)據(jù)交通云的難度和復雜度,也遠超過一般人的想象。以江蘇省的智能交通系統(tǒng)為例,實現(xiàn)數(shù)據(jù)實時入庫、動態(tài)更新以及查詢,數(shù)據(jù)量非常大,每年要更新12億條以上的信息量。
程維認為,交通大數(shù)據(jù)能力的構建,其復雜程度甚至超過搜索,他將其總結(jié)為三大特點:實時性,每過1分鐘交通情況以及車的位置都會發(fā)生變化;雙向互動,需求方用戶和供給方司機相互影響,除了滿足用戶,系統(tǒng)要根據(jù)司機喜好推薦最好的訂單;集群擾動,比如,100個人或10000人搜索,結(jié)果不會有什么區(qū)別,但是10個人還是200人一起叫車,運算結(jié)果完全不同,“滴滴代表的交通云,涉及深度學習、人工智能等技術前沿,令云平臺更智能、更高效,這是公司最重要的事情?!?/span>
“互聯(lián)網(wǎng)的競爭,已從早期的產(chǎn)品競爭、營銷競爭、資本競爭,實實在在進入云端、大數(shù)據(jù)端的競爭,”程維表示,“全球大的互聯(lián)網(wǎng)出行領域,最尖端的競爭就集中在大數(shù)據(jù)領域。”
占據(jù)技術制高點的背后,是頂尖人才的爭奪。滴滴的全球競爭對手,幾乎早于他們動手前的半年,就開始收羅全球頂尖大學的大數(shù)據(jù)研究人員,從主任、專家到一線工作人員,幾乎一網(wǎng)打盡,甚至有公司專門派一支隊伍在MIT實驗室旁蹲守兩個月,“先從副主任挖起,再找主任,一個帶一個把30多個實驗室的人徹底挖空?!?/span>
關鍵在頂層設計
6年前即深耕工業(yè)大數(shù)據(jù),美林數(shù)據(jù)總裁王璐深有感觸,“大數(shù)據(jù)對整個工業(yè)帶來的沖擊是太大太大了”,而美林只專注兩件事:工業(yè)大數(shù)據(jù)中心的建設以及對數(shù)據(jù)的分析、挖掘、高維可視化?!啊畠苫诤稀诵氖鞘裁??我們認為是數(shù)據(jù)的管理,只有在工業(yè)4.0時代,才實現(xiàn)了‘兩化’的強連接,代表工業(yè)化和信息化高度嵌入到一個整體系統(tǒng)?!?/span>
在王璐看來,大數(shù)據(jù)時代,就是會用數(shù)據(jù)說話、決策、管理、創(chuàng)新,如今,整體氛圍和思維方式的條件已具備,核心在于大數(shù)據(jù)技術的挑戰(zhàn),其中,首要的挑戰(zhàn)在于組織的頂層設計,“美林幫助很多企業(yè)進行頂層設計,兩化融合和大數(shù)據(jù)融合的戰(zhàn)略需要復雜組織系統(tǒng)的設計,尤其是數(shù)據(jù)管理的長效機制,其中,流程和組織最直接的挑戰(zhàn),就是尋找一批懂業(yè)務、懂數(shù)據(jù)還懂分析的人才隊伍?!?/span>
國家電網(wǎng)信通部主任王繼業(yè)在峰會分享了其基于頂層設計、布實施后的運營實踐。在大數(shù)據(jù)方面,國家電網(wǎng)首先規(guī)劃建立了企業(yè)級大數(shù)據(jù)平臺,通過大數(shù)據(jù)平臺實現(xiàn)數(shù)據(jù)的采集、傳輸以及存儲和處理;在大數(shù)據(jù)平臺之上建立決策支持類、實施采集類、在線監(jiān)測類、計算分析類等大數(shù)據(jù)業(yè)務應用,其中分成10大場景,在不同單位進行相應試點工作。
以電力負荷預測為例,國家電網(wǎng)組織了江蘇電力、山東電力兩家地區(qū)公司,利用大數(shù)據(jù)技術,基于電力負荷用戶檔案數(shù)據(jù),結(jié)合氣侯、氣溫變化等數(shù)據(jù),建立用電數(shù)據(jù)分析模型,實現(xiàn)用電負荷特性分析并且預測未來用點負荷曲線。
比如,江蘇電力就構建了數(shù)百個分析模型,在2015年4月對于全省的電力用電高峰進行了預測,其判斷用電高峰出現(xiàn)在8月6號,預測最高電量為8481萬千瓦時,結(jié)果,真正出現(xiàn)時間是8月5號,僅僅差一天,而實際發(fā)生的最高值為8440萬千瓦時,誤差率非常之低。
王繼業(yè)表示,基于頂層設計、有序推進,大數(shù)據(jù)帶來的威力十分之大,國家電網(wǎng)也嘗到了甜頭,“通過前期試點,負荷預測準確率提高到99.5%,最高負荷發(fā)生時間偏差1天,峰谷差率下降了5%;對配電網(wǎng)搶修精益化大數(shù)據(jù)預測,實時監(jiān)測、故障預測、搶修達標率析,設備故障預測準確率提升40%,搶修達標率達到15%,搶修時長縮短30分鐘?!?/span>
事實上,不只工業(yè)領域,響應整個社會大數(shù)據(jù)化,凝聚共識,全力推動大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新發(fā)展,形成政府、社會、市場共同推動、聯(lián)合治理的發(fā)展格局,一樣需要頂層設計;而商業(yè)公司內(nèi)部的許多數(shù)據(jù),若能在一套規(guī)則清晰的制度下進行共享,完全可以應用到宏觀經(jīng)濟和社會管理,實現(xiàn)數(shù)據(jù)價值的最大化。
龍信數(shù)據(jù)董事長李鈺就認為,應用是衡量數(shù)據(jù)價值唯一標準,龍信即將發(fā)布的是中關村企業(yè)大數(shù)據(jù)平臺,可記錄北京市百萬家企業(yè)每天的動態(tài)的經(jīng)營和稅收情況,可以洞悉全國5千萬市場主體與宏觀經(jīng)濟內(nèi)在關系,有百億的節(jié)點在秒級可以進行運算,有深度學習能力,是未來企業(yè)數(shù)據(jù)的智慧大腦,這對于宏觀經(jīng)濟決策一樣極具價值。
LinkedIn全球副總裁Michael Korcuska在峰會分享了過去3年的領英(LinkedIn)數(shù)據(jù)積累,也有非常有趣的洞察:基于中國強勁的經(jīng)濟增長,越來越多的人才從全球來到中國,其核心技能主要是經(jīng)濟學、統(tǒng)計分析、化學、社交媒體等領域,而部分離開中國的人士,其所擅長的是城市規(guī)劃、海洋、導航、水庫管理以及傳統(tǒng)中醫(yī)等。Michael Korcuska建議,利用領英的職位數(shù)據(jù)庫,政府可以做兩件事:為稀缺人才提供激勵機制,與大學合作培養(yǎng)針對性的人才。
峰會最后,寬帶資本董事長田溯寧以獨有的歷史視角,對于大數(shù)據(jù)應用的前景進行了展望。他認為,人類歷史上曾有地理大發(fā)現(xiàn)的時代,發(fā)現(xiàn)新大陸改變了人類的時空觀念,開啟了工業(yè)革命,而現(xiàn)在,人類社會正邁入“一個數(shù)據(jù)大發(fā)現(xiàn)的時代”,將開啟無限的新機會。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓練與驗證損失驟升:機器學習訓練中的異常診斷與解決方案 在機器學習模型訓練過程中,“損失曲線” 是反映模型學習狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構數(shù)據(jù)價值的核心操盤手 表格結(jié)構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11