
大數據的積累靠“偷”?到底怎么靠數據賺錢
阿里巴巴是“數據竊取者”嗎?騰訊可以“監(jiān)控”我的聊天記錄嗎?百度會記錄我所有的搜 索記錄嗎?最近,一系列關于數據的事件又重新把媒體和公眾引向關于大數據的最初的是非問題:大數據會不會泄露個人的隱私,最終,像《黑客帝國》所揭示的那樣,人被電腦所控制。
實際上,對大數據的宣傳與布道,可以說是互聯(lián)網公司最樂于見到的:顯得公司有未來感、有科技感、有益于社會、有益于用戶。但實際上,全球范圍內對大數據的應用都處于初級階段,大數據最有益的應用其實不在于事后分析,推進和改善業(yè)務,而在于做以前做不到的事情。但是即便如此,外界對于數據安全的擔憂就已經達到了相當程度:大公司會不會成為“數據竊取者”?或者說,它們會不會成為big brother,知道所有人的所有事,一旦“作惡”,后果不堪設想?
這個時候,不免要提到關于大數據的幾個誤解:
第一,大數據的積累靠“偷”?
付費通和支付寶“分手”之后,付費通暗示,是支付寶過量的用戶數據查詢導致其系統(tǒng)成本增加而最終導致分手。也就是說,付費通在指責支付寶“偷”數據。在這里我們不討論這兩家公司的恩怨是非,我們需要厘清的是,數據的積累,真的是靠“偷”?
如此理解的人,還是將大數據理解為“數量大”的數據,且越大越好。但是,大數據的精髓和要義,不在于大,而在于在線、可用和流動。要說“大”數據,歐洲對撞實驗室做一次實驗產生的數據,100個BAT分析不完。而以往存儲在磁帶、膠片,甚至是現實世界中產生的大多數數據,都不能對未來的事情有所助益——因為它們還沒有在線。
互聯(lián)網普及之后,產生的數據可謂多,而Google找到了人們對數據使用的路徑,做成了搜索引擎,把數據做成了生意。所以說,大數據的本質不在于“大”,而在于在線、可用、流動。要抓住大數據的機遇就一定要 在觀念上打破“壟斷”數據的想法,數據不能利用起來就是一堆只會占用存儲空間的無用字節(jié)而已。一些傳統(tǒng)企業(yè)由于缺乏足夠的大數據技術和經驗,面對大數據的浪潮可能習慣性采取“自我封閉”的做法,這無非只能讓自己與時代更為脫節(jié)。而即使是阿里、騰訊、百度這樣的大型互聯(lián)網公司,看似掌握了海量的數據,但和整 個社會的積累相比也只是九牛一毛而已,同樣需要在數據上跟外部保持開放和分享,并思考一條讓數據分享雙方都能獲益和實現數據增值的途徑。
第二,到底怎么靠數據賺錢?
數據不是個新鮮的東西,電力公司有你所有電力消費的信息甚至你的家庭住址,移動運營商有你所有話費消費的信息,醫(yī)院有你的健康信息,但怎么發(fā)掘這些數據更大的價值?大數據的真正價值當然不是用來預測世界杯,目前所有的大數據應用中,真正稱得上商用化產業(yè)化的還是在網絡貸款方面。
還記得銀行對小微企業(yè)是怎么放貸的呢?情況是:根本不放貸。因為評估風險的成本過高:銀行派個人實地考察下,查查水表電話,支出的人力物力成本就上千了;另一方面,阿里小貸一筆放貸的成本卻不超過1塊錢,那么,這種成本的節(jié)省,甚至導致模式的變化,怎么衡量“賺了多少錢”?很難衡量。
總的來看,實際上互聯(lián)網公司目前用大數據“賺錢”有兩種模式:一是,提供基礎的大數據處理能力,面向業(yè)界,收租用費;二是通過數據共享和交換開拓新的商業(yè)模式,共同分潤。
第一種模式,已經有很多案例。例如臉萌團隊租用某云基礎設施,每月只有73塊錢IT費用的案例被廣為傳播。
第二種模式的則比第一種模式要復雜。例如騰訊,可以將交易數據、社交網絡中的有效數據脫敏之后提取出來,與一些功能性網站(如世紀佳緣、51Job、 趕集網、大眾點評)等等合作。背后的邏輯就是:在網購方面信用好的人,也許在婚戀問題上作弊的可能性小。另外,阿里、騰訊兩家都收購或者入股了地圖公司,那么電商數據能不能和地理位置信息打通,能不能給在支付寶上買了車險的人(肯定是有車族)提供定制服務?支付寶能不能和中石油中石化合作,直接把加油站變成自提點?由此開始暢想,合作機會和可能的商業(yè)模式就多得多。
第三,大公司能做所有的事?
一個不得不承認的事實是:只有大公司有做數據基礎設施的財力物力和人力。但大公司并不能辦成所有的事。大數據的商業(yè)價值在于使用大數據的公司做得好,而平臺公司的意義,就在于提供好用的數據工具和基礎設施。
從阿里、騰訊、百度幾家做云計算(數據處理的基礎)的歷程來看,建立自主的,能適應互聯(lián)網要求、彌補IOE(IBM、Oracle、EMC)彈性差劣勢的基礎設施,投入在5年以上是一個基本量。阿里云、騰訊曾經的“臺風”項目、百度的“金字塔”項目都是歷經坎坷,有的逐步走向成功,有的夭折于短期效果和長期效果的平衡中。
家大業(yè)大才能玩大數據,但大公司并不能包攬整個大數據時代。原因主要在于:第一,大數據需要盤活,而盤活需要流動、需要共享。不然“大數據”只是“數據大”。而流動和共享則來自于大型平臺與多種垂直類網站的合作,更多的,在于和非互聯(lián)網公司的合作。
第二,大型互聯(lián)網公司的優(yōu)勢在于平臺本質:做平臺,而不親自下場做具體業(yè)務。對各行業(yè)公司來說,數據的盤活和利用在于對行業(yè)的深刻理解,這是互聯(lián)網公司本身所難以達到的。
第四,為什么沒有大數據的經典案例出現?
前幾年,Google數據預測流感的案例曾被廣為傳播。啤酒與尿布的案例則是像一塊兒鐵,在眾人的口中生了銹。而各互聯(lián)網公司用來博眼球的所謂大數據分析球賽、高考作文、春運等,其本質無非是一張Excel表單,只是事后統(tǒng)計,并沒有進一步的預測、影響經濟決策的作用。
是不是人們對于大數據的效果過于渴求了?是不是互聯(lián)網公司在人口紅利逐漸消失時,對新的商業(yè)機會的過于期待了?可以肯定的是,目前,對數據的應用,理解,甚至合理的存儲方式,都還處于初級階段。對于可作為未來核心競爭力的資產,數據并不會像絢爛的煙花綻放,更像空氣、水、電,以一種無聲的方式浸入和改變世 界。
而我們要做的,無非是不要讓恐懼排擠了精彩。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA 數據分析師報考條件詳解與準備指南? ? 在數據驅動決策的時代浪潮下,CDA 數據分析師認證愈發(fā)受到矚目,成為眾多有志投身數 ...
2025-07-18剛入職場或是在職場正面臨崗位替代、技能更新、人機協(xié)作等焦慮的打工人,想要找到一條破解職場焦慮和升職瓶頸的系統(tǒng)化學習提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數據密不可分。網易公司創(chuàng)始人丁磊在《AI思維:從數據中創(chuàng)造價值的煉金術 ...
2025-07-18CDA 數據分析師:數據時代的價值挖掘者 在大數據席卷全球的今天,數據已成為企業(yè)核心競爭力的重要組成部分。從海量數據中提取有 ...
2025-07-18SPSS 賦值后數據不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數據分析過程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實現表數據同步操作指南? ? 在數據庫管理工作中,將一張表的數據同步到另一張表是常見需求,這有助于 ...
2025-07-18數據分析師的技能圖譜:從數據到價值的橋梁? 在數據驅動決策的時代,數據分析師如同 “數據翻譯官”,將冰冷的數字轉化為清晰的 ...
2025-07-17Pandas 寫入指定行數據:數據精細化管理的核心技能? 在數據處理的日常工作中,我們常常需要面對這樣的場景:在龐大的數據集里精 ...
2025-07-17解碼 CDA:數據時代的通行證? 在數字化浪潮席卷全球的今天,當企業(yè)決策者盯著屏幕上跳動的數據曲線尋找增長密碼,當科研人員在 ...
2025-07-17CDA 精益業(yè)務數據分析:數據驅動業(yè)務增長的實戰(zhàn)方法論 在企業(yè)數字化轉型的浪潮中,“數據分析” 已從 “加分項” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實踐 在 MySQL 數據庫表結構設計中,索引是提升查詢性能的核心手段。無論 ...
2025-07-16解析 MySQL Update 語句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數據庫的日常運維與開發(fā)中,開發(fā)者和 DBA 常會 ...
2025-07-16如何考取數據分析師證書:以 CDA 為例? ? 在數字化浪潮席卷各行各業(yè)的當下,數據分析師已然成為企業(yè)挖掘數據價值、驅動決策的 ...
2025-07-15CDA 精益業(yè)務數據分析:驅動企業(yè)高效決策的核心引擎? 在數字經濟時代,企業(yè)面臨著前所未有的數據洪流,如何從海量數據中提取有 ...
2025-07-15MySQL 無外鍵關聯(lián)表的 JOIN 實戰(zhàn):數據整合的靈活之道? 在 MySQL 數據庫的日常操作中,我們經常會遇到需要整合多張表數據的場景 ...
2025-07-15Python Pandas:數據科學的瑞士軍刀? ? 在數據驅動的時代,面對海量、復雜的數據,如何高效地進行處理、分析和挖掘成為關鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數據操作的 “后悔藥” 指南? 在數據庫操作中,誤刪數據、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14t檢驗與Wilcoxon檢驗的選擇:何時用t.test,何時用wilcox.test? t 檢驗與 Wilcoxon 檢驗的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14AI 浪潮下的生存與進階: CDA數據分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導白皮書) 發(fā)布機構:CDA數據科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11