
對(duì)于大數(shù)據(jù)存在多少偏見(jiàn)乃至誤讀呢
近幾年,得益于資本追捧、企業(yè)造勢(shì)、媒體推廣以及公眾往往跟風(fēng)式參與,一些新概念或被引進(jìn)、或被改造、或被提煉,其中代表性的有:大數(shù)據(jù)、互聯(lián)網(wǎng)思維、“互聯(lián)網(wǎng)+”、云計(jì)算、智慧城市、媒體融合、人工智能、IP、VR/AR等。其傳播套路(流行持久度)大致為:今天你爆紅,明日我當(dāng)?shù)?,各領(lǐng)風(fēng)騷真熱鬧。只是,在一陣陣浮躁、喧囂與狂熱的背后,這些新概念究竟有多少真正被正確理解了,而又有多少存在偏見(jiàn)乃至誤讀呢?
特別值得說(shuō)說(shuō)的,首推大數(shù)據(jù)。
對(duì)這個(gè)舶來(lái)的、隨著2012年在有著“大數(shù)據(jù)商業(yè)應(yīng)用第一人”之稱的維克托·舍恩伯格那本全球級(jí)暢銷書(shū)《大數(shù)據(jù)時(shí)代》隆重登場(chǎng)的新概念,先是在國(guó)內(nèi)的互聯(lián)網(wǎng)業(yè)界刮起一陣超級(jí)旋風(fēng),繼而風(fēng)靡了整個(gè)社會(huì),由科技界的熱門詞變身為社會(huì)高頻詞,人人爭(zhēng)說(shuō)大數(shù)據(jù),唯恐掉隊(duì)落伍。說(shuō)得更尖銳些,和絕大多數(shù)“新概念”一樣,“大數(shù)據(jù)”已經(jīng)成了許多閉門造車者竭盡全力宣揚(yáng)的主題。這種現(xiàn)象與2005年盛極一時(shí)的Web2.0革命論如出一轍。那么,結(jié)果如何呢?在“中國(guó)互聯(lián)網(wǎng)老兵”謝文看來(lái),“一個(gè)概念,無(wú)論它可以抽象到多么高深的程度,其形成、演變、推廣的過(guò)程往往卻很實(shí)在、具體,充斥著不同社會(huì)力量的博弈。這個(gè)概念的對(duì)錯(cuò)與否、生命力的長(zhǎng)短、對(duì)社會(huì)的影響往往不取決于概念本身,而在于它的社會(huì)價(jià)值”。因此他得出結(jié)論,“關(guān)于大數(shù)據(jù),你知道的都不對(duì)!”
《大數(shù)據(jù)經(jīng)濟(jì)》是謝文的第二本書(shū),距離上一部《為什么中國(guó)沒(méi)出Facebook》已過(guò)去了五年。很難想象,自上世紀(jì)90年代中期留美歸國(guó)后,就先后在中公網(wǎng)及其所屬聯(lián)眾游戲網(wǎng)站、互聯(lián)網(wǎng)實(shí)驗(yàn)室等知名企業(yè)擔(dān)任CEO、董事等職務(wù),曾擔(dān)任和訊網(wǎng)CEO和雅虎中國(guó)總裁等職的業(yè)界大咖,頻繁在各大紙媒撰文發(fā)表業(yè)界觀察和產(chǎn)業(yè)心得的人,在出書(shū)這個(gè)舉動(dòng)上卻如此“惜字如金”。但或許也正是如此,使閱讀謝文作品成了一種智性訓(xùn)練和與智者的對(duì)話。在謝文冷靜、平和的文字背后,體現(xiàn)了他作為中國(guó)互聯(lián)網(wǎng)發(fā)展數(shù)朝元老的老練沉穩(wěn),這種面對(duì)洶涌浪潮波瀾不驚的定力,除了來(lái)自專業(yè)理性的思考,便是長(zhǎng)年累月、一以貫之的行業(yè)沉淀。
按照架構(gòu),《大數(shù)據(jù)經(jīng)濟(jì)》旨在向公眾澄清有關(guān)大數(shù)據(jù)的一些謬誤,正本清源、回歸真相。而主體內(nèi)容則收錄了謝文從2012年上半年起至今陸陸續(xù)續(xù)寫的一系列關(guān)于大數(shù)據(jù)現(xiàn)象的專欄文章。雖然每篇議題各有側(cè)重、篇幅也長(zhǎng)短不一,但核心繞不開(kāi)以下幾個(gè)論點(diǎn):第一,時(shí)下,對(duì)大數(shù)據(jù)的概念界定實(shí)際上仍然模糊不清、模棱兩可;第二,當(dāng)前大數(shù)據(jù)實(shí)踐都還屬于摸著石頭過(guò)河的階段,這符合產(chǎn)業(yè)發(fā)展規(guī)律,大體來(lái)看,第一波創(chuàng)新嘗試集中在網(wǎng)絡(luò)業(yè)、制造業(yè)和公共服務(wù)業(yè)以及三者之間的融合互動(dòng)上;第三,大數(shù)據(jù)是一種世界觀、歷史觀、價(jià)值觀、方法論;第四,數(shù)據(jù)服務(wù)將是未來(lái),而數(shù)據(jù)共享與公開(kāi)將是大數(shù)據(jù)藍(lán)海的歷史使命。當(dāng)然,他更不否認(rèn)接下來(lái)的第五點(diǎn):大數(shù)據(jù)時(shí)代對(duì)社會(huì)現(xiàn)有結(jié)構(gòu)、體制、文化和生活方式的沖擊與變革遠(yuǎn)大于計(jì)算機(jī)時(shí)代和互聯(lián)網(wǎng)時(shí)代?!艾F(xiàn)在正是大數(shù)據(jù)帶來(lái)的大變革的前夜,面對(duì)這場(chǎng)勢(shì)將席卷全球的社會(huì)大變革,主動(dòng)比被動(dòng)好,早動(dòng)比晚動(dòng)好,不動(dòng)不是一個(gè)選擇。”
僅就這些觀點(diǎn)而論,謝文其實(shí)并不孤單,就拿國(guó)內(nèi)來(lái)說(shuō)吧,至少像《決戰(zhàn)大數(shù)據(jù)》的作者車品覺(jué)、《大數(shù)據(jù)》和《數(shù)據(jù)之巔》的作者涂子沛等幾位,都與他“英雄所見(jiàn)略同”。
此外,我們也看到了謝文的憂慮。在書(shū)中他憂心忡忡地指出,大數(shù)據(jù)是整個(gè)Web2.0革命的重要組成部分,世界網(wǎng)絡(luò)業(yè)的領(lǐng)軍公司,例如Google、Facebook、蘋果和亞馬遜已占據(jù)了先發(fā)的位置。我國(guó)網(wǎng)絡(luò)業(yè)中哪家公司能急起直追,誰(shuí)就是先行者,否則,就只能扮演受害者的角色了。至于未來(lái)的戰(zhàn)略方向,謝文建議有識(shí)之士重視數(shù)據(jù)服務(wù)業(yè),數(shù)據(jù)服務(wù)業(yè)和現(xiàn)有的相關(guān)產(chǎn)業(yè)的根本區(qū)別在于其商業(yè)模式是數(shù)據(jù)驅(qū)動(dòng)型,是對(duì)大數(shù)據(jù)的深度分析加工,是對(duì)大數(shù)據(jù)的多重利用和深度利用,是對(duì)現(xiàn)有簡(jiǎn)單直接商業(yè)模式的增值服務(wù)。《大數(shù)據(jù)經(jīng)濟(jì)》提到,包括蘋果公司和谷歌在內(nèi)的世界巨頭,都在不計(jì)成本地全方位增加生產(chǎn)和獲取大數(shù)據(jù),就是為了在走向數(shù)據(jù)服務(wù)業(yè)的過(guò)程中贏得先發(fā)優(yōu)勢(shì),為未來(lái)的領(lǐng)先地位在下一盤很大的棋。
謝文為此毫不客氣地批評(píng)國(guó)內(nèi)公司一擁而上生產(chǎn)智能手機(jī)的現(xiàn)象:“如果自身沒(méi)有成熟配套的操作系統(tǒng)、開(kāi)放平臺(tái)、云計(jì)算后臺(tái)和數(shù)據(jù)分析加工平臺(tái),單兵突進(jìn)只做手機(jī),也許在某個(gè)時(shí)段能賺點(diǎn)錢,但從長(zhǎng)遠(yuǎn)看是沒(méi)有前途的。那些在手機(jī)首頁(yè)集成點(diǎn)自己的服務(wù),高呼搶占網(wǎng)絡(luò)入口口號(hào)的伎倆,在滾滾而來(lái)的大數(shù)據(jù)洪流面前顯得那么蒼白無(wú)力。何不舍棄雞肋,重新定位,發(fā)揮優(yōu)勢(shì),爭(zhēng)取不在大數(shù)據(jù)時(shí)代掉隊(duì)呢?”商業(yè)、資本固然有“趨利性”的一面,也就是什么賺錢做什么,而謝文的洞見(jiàn)在于,“趨利性”與“趨勢(shì)性”并不矛盾,而后者是謀定而后動(dòng),去做一些更長(zhǎng)遠(yuǎn)、更深遠(yuǎn)的產(chǎn)業(yè)布局。很可惜,并沒(méi)有多少人能意識(shí)得到這一層,而這恰恰也回應(yīng)了他當(dāng)年的“謝氏之問(wèn)”——為什么中國(guó)沒(méi)有Facebook?
客觀地講,由于《大數(shù)據(jù)經(jīng)濟(jì)》是謝文之前媒體專欄文章的結(jié)集,因而在時(shí)效性上多少有點(diǎn)欠缺,即便國(guó)務(wù)院印發(fā)的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》也才大半年前的事,但互聯(lián)網(wǎng)風(fēng)向轉(zhuǎn)變之快,已不是三五年為一個(gè)周期的“后浪推前浪”了。另外,本書(shū)還收錄了其他非“大數(shù)據(jù)”主題的文章,議題從移動(dòng)互聯(lián)網(wǎng)創(chuàng)新到“互聯(lián)網(wǎng)+”再到寬帶戰(zhàn)略、公司研究等等,內(nèi)容難免顯得有些繁雜。不過(guò),鑒于謝文十幾年如一日跟蹤中國(guó)互聯(lián)網(wǎng)產(chǎn)業(yè)的發(fā)展步態(tài),鍥而不舍地發(fā)些看似不合時(shí)宜的聲音,他的作品仍被筆者列在必讀范疇之內(nèi)。至于媒體把他尊稱為“中國(guó)的凱文·凱利”,則未免有些不著邊際。謝文從來(lái)不輸出技術(shù)哲學(xué),也不信奉先驗(yàn)主義,他只是在持續(xù)不斷地講述常識(shí)。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過(guò)程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語(yǔ)言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11