
百度“工業(yè)革命”思維:大數(shù)據(jù)再造互聯(lián)網(wǎng)
騰訊創(chuàng)始人馬化騰就用“互聯(lián)網(wǎng)+”來概括互聯(lián)網(wǎng)行業(yè)的未來機會,即互聯(lián)將向更多的傳統(tǒng)行業(yè)滲透,并使傳統(tǒng)行業(yè)脫胎換骨;百度創(chuàng)始人李彥宏則認為互聯(lián)網(wǎng)未來有一個趨勢,除了馬化騰論及的“互聯(lián)網(wǎng)+”之外,另一個趨勢是互聯(lián)網(wǎng)本身也在被技術改變,此前一波是移動技術,未來主要是云計算與大數(shù)據(jù)。
“互聯(lián)網(wǎng)+”是已經(jīng)發(fā)生的事情。李彥宏說:“接下來發(fā)生的事是技術改變互聯(lián)網(wǎng)?!?/span>
4月24日,百度第四屆技術開放日在北京舉行,會議的主題是“大數(shù)據(jù)引擎驅(qū)動未來”。百度在當日宣布發(fā)布大數(shù)據(jù)引擎,并將這一大數(shù)據(jù)引擎向外界開放,為其提供大數(shù)據(jù)存儲、分析及挖掘的技術能力。這是全球首個開放大數(shù)據(jù)引擎。
百度大數(shù)據(jù)引擎的意義是什么?至少包括兩個方面的意思:一是利用新技術,特別是移動、云計算、大數(shù)據(jù)技術改造互聯(lián)網(wǎng);二是打造一個開放平臺,把“互聯(lián)網(wǎng)+”的思想引入更多行業(yè)。
數(shù)據(jù)開放平臺
百度大數(shù)據(jù)引擎包含三層開放平臺,分別是開放云、數(shù)據(jù)工廠、百度大腦。
百度開放云解決的是數(shù)據(jù)存儲和計算瓶頸,這是由百度低能耗數(shù)據(jù)中心和分布式運算架構等技術來解決;在數(shù)據(jù)工廠平臺,百度提供了“大數(shù)據(jù)挖掘機”把數(shù)據(jù)關聯(lián)起來,并從中挖掘出它的價值;百度大腦建立在百度深度學習和大規(guī)模機器學習基礎之上,現(xiàn)在已經(jīng)可以模擬兩、三歲嬰兒的智力水平。
隨著移動設備的普及,現(xiàn)在的人們已經(jīng)隨時隨地都在產(chǎn)生數(shù)據(jù),無論是某個PC網(wǎng)站上購物,搜索某條新聞,或是在手機玩某一個游戲,這些行為都會留下數(shù)據(jù)。
這種趨勢還會繼續(xù)。未來產(chǎn)生的數(shù)據(jù),除了電腦、手機外,還有移動傳感器、可穿戴設備、智能電視、車載電子設備,也包括了手機定位器、手機照相機等。這些設備會產(chǎn)生更加豐富的數(shù)據(jù),使未來成為一個“大數(shù)據(jù)”時代。
在設備方面,百度開始進行嘗試投資,包括智能手環(huán)、智能手機等產(chǎn)品。這些硬件產(chǎn)品多與第三方公司合作,百度出技術、出錢,甚至出人。百度的目的就是把百度的技術,包括搜索、地圖等植入到這些硬件產(chǎn)品中,獲得更多數(shù)據(jù)。
李彥宏把這一策略稱為“baidu inside”,類似PC時代的“wintel inside”,不同的是,“baidu inside”是免費的,目的在于數(shù)據(jù),“wintel inside”很昂貴,在PC時代,微軟與英特爾攫取整個產(chǎn)業(yè)大部分利潤。
百度高級副總裁王勁說,現(xiàn)在這個時代是一個數(shù)據(jù)大爆炸的年代,每個人,每個機構都要適應這一變化。
百度大數(shù)據(jù)引擎已經(jīng)推出了一些十分好玩的服務:今年春節(jié)期間,百度和央視一起做了“百度遷徙活動”,利用基于百度地圖LBS開放平臺,根據(jù)每天多達70億次的定位信息,在地圖上直觀顯示春運期間人們怎樣運動。
另外例子是百度大腦與語音識別技術相結合的應用:可以把海量的嬰兒聲音上傳到大數(shù)據(jù)中心提取特征,年輕父母可以錄下嬰兒哭聲上網(wǎng)比對,就知道孩子因為什么哭,是餓了,還是想撒撒嬌,讓沒有帶孩子經(jīng)驗的父母得到幫助。
百度工業(yè)革命
上述好玩的應用只是百度自己在百度大數(shù)據(jù)引擎上開發(fā)出來的應用;百度未來要把百度大數(shù)據(jù)引擎開放給更多行業(yè)的更多企業(yè),讓他們插上互聯(lián)網(wǎng)的翅膀。
王勁舉了一個醫(yī)療行業(yè)的例子,現(xiàn)在已經(jīng)有很多可穿戴設備能夠24小時每天監(jiān)控健康狀況,記錄血壓、心跳、睡眠狀況、運動狀況,檢測汗液、血液,分析用戶的身體情況,并且24小時不間斷地把檢測數(shù)據(jù)上傳到大數(shù)據(jù)中心。
王勁說:如果把這些數(shù)據(jù)跟醫(yī)院關聯(lián),這些數(shù)據(jù)將產(chǎn)生極大的價值。
王勁以心臟病做例子解釋:每年有幾百萬人得了心臟病,百度大數(shù)據(jù)中心具有很好的計算能力,可以從幾百萬患者的24小時監(jiān)控數(shù)據(jù)里頭找到它的共性,我們提前兩天給人發(fā)預警,如果你再這樣下去就有可能得心臟病,由醫(yī)院給人群發(fā)出警告,由于預防的代價遠遠低于治療的代價,我們有可能把治的成本轉(zhuǎn)換成預防的成本,提高了人們對疾病預防的能力,也能極大改變醫(yī)患之間關系。
另一個可以改變的行業(yè)是保險行業(yè):保險公司希望降低賠付率,在預防的模式下就可以降低賠付率,就有可能打造一個多方共贏新的醫(yī)療模式。
百度大數(shù)據(jù)引擎另一技術是以圖搜圖的技術:用手機拍一張某人現(xiàn)在的照片,就能在網(wǎng)上把這個人過去在網(wǎng)上所有的照片都找出來。
李彥宏認為:未來數(shù)據(jù)會無處不在,無論做什么事情都離不開大數(shù)據(jù),百度開放自己的大數(shù)據(jù)核心能力,將更好地幫助傳統(tǒng)行業(yè)挖掘數(shù)據(jù)價值,加快傳統(tǒng)行業(yè)轉(zhuǎn)型升級,進而發(fā)揮出對整體社會經(jīng)濟的革命性影響。
李彥宏表示,“海量數(shù)據(jù)存儲、關聯(lián)、分析是大數(shù)據(jù)時代的關鍵,是挑戰(zhàn)更是機遇?!卑俣韧瞥龃髷?shù)據(jù)引擎,旨在幫助各行業(yè)應對挑戰(zhàn),推動社會大數(shù)據(jù)、行業(yè)大數(shù)據(jù)的價值挖掘進程,幫助各行業(yè)發(fā)現(xiàn)并抓住新機會。
并不是每個公司都有存儲、關聯(lián)、分析大數(shù)據(jù)的能力,百度大數(shù)據(jù)引擎就是給這些公司提供存儲、關聯(lián)、分析大數(shù)據(jù)的能力,提供大數(shù)據(jù)基礎設施。
李彥宏說,互聯(lián)網(wǎng)發(fā)展已有二十年,這二十年就是各行各業(yè)被互聯(lián)網(wǎng)沖擊的二十年,最先受到?jīng)_擊的是媒體,然后是零售業(yè),旅游,剛剛開始的是金融業(yè)。
每一次涅槃,也是一次重生。李彥宏認為,未來會有更多行業(yè)被卷入,而且被卷入的速度越來越快,是一個加速發(fā)展的過程,產(chǎn)生一場新的工業(yè)革命。
百度本身是一個互聯(lián)網(wǎng)公司,但卻同樣需要擁抱互聯(lián)網(wǎng):百度搜索引擎抓住的是互聯(lián)網(wǎng)巔覆媒體的潮流,百度需要變化,迎接下一波潮流。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10