
大數(shù)據(jù)如何玩兒?這是BAT的不同思路
去年5月筆者曾撰文闡述百度、阿里和騰訊這三個互聯(lián)網(wǎng)巨無霸開始挖掘大數(shù)據(jù)。一年過去,擁有海量數(shù)據(jù)的公司已在多個領(lǐng)域嘗試對掌握的數(shù)據(jù)進行利用,大數(shù)據(jù)意識和能力進步飛快,體系和工具日趨成熟。
大數(shù)據(jù)應用實踐,碩果累累
百度在大數(shù)據(jù)方面讓人印象深刻的有百度遷徙這樣的公益項目,應用在民生和新聞等領(lǐng)域。最新動態(tài)是,百度網(wǎng)盟利用基于大數(shù)據(jù)的CTR(廣告內(nèi)容匹配)數(shù)據(jù),站長的平均收入提升70%。
阿里則對外宣稱已經(jīng)擁有100PB數(shù)據(jù)并以令人欣喜的速度增長,馬云最新的內(nèi)部郵件將阿里戰(zhàn)略闡述為云端+大數(shù)據(jù),阿里要進入數(shù)據(jù)時代。
騰訊廣點通平臺不乏亮點應用,例如美麗說借助廣點通在移動端取得豐收,小米手機與QQ空間合作更是基于社交數(shù)據(jù)營銷的經(jīng)典。
百度、阿里均已將大數(shù)據(jù)升級為公司戰(zhàn)略,李彥宏、雷軍等互聯(lián)網(wǎng)代表人物在兩會時都曾有建言,推動政府的大數(shù)據(jù)意識和開放,大數(shù)據(jù)正在從理論走向?qū)嵺`,從專業(yè)領(lǐng)域走向全民應用的階段。
互聯(lián)網(wǎng)牽頭大數(shù)據(jù)的必然性
為什么國內(nèi)的大數(shù)據(jù)應用,只有幾個互聯(lián)網(wǎng)巨頭取得成就呢?是因為它們擁有最多的用戶、流量和數(shù)據(jù)嗎?答案是否定的。因為所有關(guān)于大數(shù)據(jù)的論斷都認為,大數(shù)據(jù)并不在于大。質(zhì)量、性質(zhì)以及誰擁有它,將決定大數(shù)據(jù)能被挖掘出來的價值和難度。
物聯(lián)網(wǎng)傳感器、視頻監(jiān)控設(shè)備時時刻刻都在收集海量數(shù)據(jù),但價值沒有微博大,因為數(shù)據(jù)難以變現(xiàn)。運營商擁有用戶通信相關(guān)數(shù)據(jù),從語音到短信再到位置,量大過任何一個互聯(lián)網(wǎng)巨頭。只能白白浪費,因為運營商不被允許也無能力去利用這些數(shù)據(jù)。與之類似,政府部門、軟件企業(yè)均擁有大數(shù)據(jù),卻只能任其沉睡。
之所以BAT走在國內(nèi)大數(shù)據(jù)應用的前列,即與其擁有的數(shù)據(jù)性質(zhì)有管,與互聯(lián)網(wǎng)企業(yè)的技術(shù)基因、開放創(chuàng)新和積極進取有關(guān)。
大數(shù)據(jù)利用難點在于技術(shù)。從數(shù)據(jù)的收集到存儲到清洗,再到脫敏,歸類,標簽化、結(jié)構(gòu)化,以及最后的建模分析、挖掘利用,均是技術(shù)活兒。需要服務器集群、數(shù)據(jù)利用模型和數(shù)據(jù)處理算法來保障,然后才是挖掘出來的結(jié)果的包裝、變現(xiàn)。
相對其他擁有大數(shù)據(jù)的金主來說,互聯(lián)網(wǎng)企業(yè)的技術(shù)甩開它們幾條街。運營商技術(shù)是外包;銀行的技術(shù)外包居多;其他公共部門例如政府、交通、教育、能源等行業(yè),技術(shù)對他們是遙遠的名詞。
還有動機?;ヂ?lián)網(wǎng)企業(yè)的服務產(chǎn)品幾乎是免費,必須通過其他模式賺錢。過去是廣告、游戲和增值這三種模式,到了移動端廣告模式遇到瓶頸,需要新模式,抑或加強原有模式。這兩點上,大數(shù)據(jù)都會起到大的作用。
BAT大數(shù)據(jù)思路迥異
BAT三家的數(shù)據(jù)各有特色。
百度是基于用戶搜索行為的需求數(shù)據(jù),阿里掌握著交易以及信用數(shù)據(jù),騰訊則掌握著社交關(guān)系數(shù)據(jù)。各有千秋。它們對大數(shù)據(jù)的應用方向并不相同。百度和阿里更為激進。騰訊觀望多過行動,也可能是說得少做得多。
首先是動機。
百度收入95%以上來自廣告,淘寶的主要收入模式也是廣告。百度、淘寶和CCTV是中國前三大廣告投放陣地。騰訊主要收入來自游戲和社交增值業(yè)務,廣告收入占比僅為三成左右。
本階段大數(shù)據(jù)變現(xiàn)的主要途徑是精準廣告,這契合百度和阿里的訴求,兩家將大數(shù)據(jù)升級為公司戰(zhàn)略。
其次是技術(shù)。
搜索引擎是技術(shù)驅(qū)動,百度和其創(chuàng)始人李彥宏最具技術(shù)基因。馬云對外宣稱因為其不懂技術(shù)所以阿里技術(shù)最強。只有騰訊不怎么強調(diào)技術(shù),一直強調(diào)產(chǎn)品能力。
大數(shù)據(jù)是技術(shù)活兒,百度和阿里這兩位自認為技術(shù)很強的玩家探索在先符合常理。百度和阿里在大數(shù)據(jù)技術(shù)已經(jīng)進行較多布局,從人才到架構(gòu)到基礎(chǔ)設(shè)施再到技術(shù)理論。
百度有深度學習研究院、高價聘請大數(shù)據(jù)領(lǐng)域人才以及與高校合作,正在建設(shè)亞洲最大云計算機房;阿里有飛天計劃,有先進的跨機房5k集群、Apsara分布式計算系統(tǒng),還有數(shù)據(jù)委員會這樣的架構(gòu)。
幾家在云計算平臺上的不同態(tài)度可以佐證我的觀點。云平臺和大數(shù)據(jù)是連體嬰。“移動端”、合作伙伴和用戶個人的數(shù)據(jù),均需要“云”來收集、存儲和處理。要掌握大數(shù)據(jù),一定要具備承載數(shù)據(jù)的開放的云。
阿里云09年成立,百度云12年推出,分別對應到IaaS模式和PaaS(Amazon VS Google)。它們的云服務在向開發(fā)者和用戶提供基礎(chǔ)設(shè)施、云端服務的同時,收集第三方網(wǎng)站、應用、硬件和用戶的數(shù)據(jù)。百度遷徙能夠生效便是得益于第三方App為百度貢獻位置數(shù)據(jù)。
騰訊云去年9月才推出,起步晚了點。雖然騰訊開放平臺成熟,但開放平臺更多是分享騰訊的用戶和資源出來,目的不是收集數(shù)據(jù)。而且開放平臺是運營、合作、生態(tài)層面的事,云平臺才是技術(shù)問題。
最后是位置。
典型的互聯(lián)網(wǎng)交易場景大概是這樣的,用戶在聊天、社交、娛樂的過程中,會被吸引注意力,關(guān)注“興趣”,抑或因為興趣而發(fā)現(xiàn)新的信息。然后用戶去了解、去尋找想要的東西(需求、欲望、找到所求),最后在網(wǎng)上完成交易(電商和O2O)。
這里引用一下漏斗模型——一個悠久經(jīng)典的營銷概念。在這個模型里,用戶消費時的大致決策路徑是從注意(attention)、興趣(interest)、欲望(desire)最后到行動(action)。
上圖是被倒過來的漏洞。漏斗越到底部轉(zhuǎn)化率越高。阿里在欲望和行動之間,百度在興趣和欲望之間,騰訊則在漏洞頂部。
廣告收費模式可以看出三家的位置差異。百度是CPC,按照點擊次數(shù)付費(不管點擊后的行為),阿里淘寶客等廣告則直接可以對應到購買行為,CPA(按實際效果)和CPS(按效果傭金)居多。騰訊門戶、QQ聊天Banner廣告更親睞于CPM或者CPT(按照展示次數(shù)或者時長),廣點通是CPA,但亮點案例集中在應用下載領(lǐng)域,而不是交易領(lǐng)域。
三家都不希望只處于某一個環(huán)節(jié),而是期望上中下通吃。百度有貼吧這樣的興趣社交產(chǎn)品,有視頻這種注意力型業(yè)務,還推出了直接在結(jié)果頁下單的“微購”,上下延展;騰訊重組了搜索業(yè)務(與搜狗合并)和電商業(yè)務(與京東合并),向下的機會還有;阿里投資微博、布局智能電視以及做導購網(wǎng)站做微淘,努力在向上走。
幾個互聯(lián)網(wǎng)巨頭的動機、技術(shù)和位置的不同,在大數(shù)據(jù)應用上的思路也不同:騰訊蜻蜓點水,阿里布局為先,百度技術(shù)至上。相同的是,幾家都在想方設(shè)法籠絡(luò)更多的數(shù)據(jù),收集數(shù)據(jù)是第一階段,形成收集數(shù)據(jù)的能力和機制是第二階段,第三階段才是數(shù)據(jù)挖掘,目前BAT三家均處于從第二階段到第三階段之間,一旦大數(shù)據(jù)應用全面進入第三階段,積累更深、投入更多的百度或?qū)⒂型@出優(yōu)勢。
AppStore和iPhone的誕生,將人們帶入了智能手機和移動互聯(lián)網(wǎng)時代,顛覆了傳統(tǒng)的軟件業(yè)和手機業(yè)。未來,對大數(shù)據(jù)商業(yè)價值的發(fā)掘?qū)⒔o互聯(lián)網(wǎng)公司拓展出更大的增長空間,甚至有可能催生出全新的商業(yè)模式和硬件產(chǎn)品,就像AppStore和iPhone那樣,給人們的工作和生活方式帶來顛覆性的變化。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預測分析中的應用:從數(shù)據(jù)查詢到趨勢預判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學方法在市場調(diào)研數(shù)據(jù)中的深度應用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03