
大數(shù)據(jù)時(shí)代,誰還需要公知
原本發(fā)跡于互聯(lián)網(wǎng)的“意見領(lǐng)袖”、“公知”與各類“專家”、“學(xué)者”一步步走向窮途末路,短短十年不到,從“萬眾矚目”淪落到“聲名狼藉”的不在少數(shù),更多的是跳兩年就銷聲匿跡了。很多人覺得這是“專家”、“公知”們水平、素質(zhì)太差造成的,其實(shí),這是一個(gè)很大的誤解。
現(xiàn)在活躍于網(wǎng)絡(luò)上的專家學(xué)者與公知們,無論從知識(shí)面還是見解上,都不比以往任何時(shí)代的同類們差多少,不幸的是,他們生活在知識(shí)大爆炸的互聯(lián)網(wǎng)時(shí)代,且進(jìn)入到前所未有的大數(shù)據(jù)時(shí)代。他們沒有與時(shí)俱進(jìn),或者根本沒法與時(shí)俱進(jìn)。
我理解的“大數(shù)據(jù)”時(shí)代,就是一切東西都能變成數(shù)字,通過機(jī)器與云計(jì)算,把這些數(shù)字變成數(shù)據(jù),人們?cè)絹碓絻A向利用所有的數(shù)據(jù),而不是一小部分?jǐn)?shù)據(jù)來認(rèn)識(shí)世界、預(yù)測(cè)未來。這一變化,使得傳統(tǒng)意義上的“專家”不得不讓位給會(huì)操作電腦的計(jì)算師、統(tǒng)計(jì)師與數(shù)據(jù)分析師。簡而言之,傳統(tǒng)意義上的“專家”就是通過自己掌握的知識(shí),通過對(duì)盡量多案例的收集與分析,總結(jié)出普遍規(guī)律,從而利用這個(gè)普遍規(guī)律去解決更多個(gè)體案例的問題,指導(dǎo)當(dāng)下、預(yù)測(cè)未來。
問題是在大數(shù)據(jù)時(shí)代,人們已經(jīng)不再依賴對(duì)少數(shù)案例的分析總結(jié)規(guī)律,找出因果,科技的發(fā)展完全可以通過對(duì)大量(甚至全部)的數(shù)據(jù)收集和分析,得出更準(zhǔn)確的結(jié)論。例如,你今天病了,咳嗽、發(fā)燒、喉嚨疼,你去看醫(yī)生,他根據(jù)你的三個(gè)癥狀得出了結(jié)論:感冒。
他怎么得出結(jié)論的?因?yàn)獒t(yī)藥書上對(duì)有這三個(gè)癥狀的人的跟蹤研究顯示,百分之九十幾的這類人,都是得了感冒。但“大數(shù)據(jù)”時(shí)代有更簡單的辦法:通過對(duì)全球有這三個(gè)癥狀的人的全部統(tǒng)計(jì)(在電腦計(jì)算如此發(fā)達(dá)的時(shí)代,如果得到醫(yī)療部門的支持,可能只需要幾個(gè)小時(shí)吧),不難得出更準(zhǔn)確的結(jié)論:百分之九十九點(diǎn)XXXX的人是得了感冒,其中百分之0.XXX的人為此而死亡。如果把這個(gè)數(shù)據(jù)進(jìn)一步分類,更細(xì)化且找到他們使用過的藥物,你下次感冒了,恐怕就不一定要去掛號(hào)、排隊(duì)看醫(yī)生吧,不如直接去一個(gè)配備了一臺(tái)載有大數(shù)據(jù)資料庫的藥房。
實(shí)際上,醫(yī)學(xué)上的“大數(shù)據(jù)”早就在實(shí)行了,記得二十多年前,一位領(lǐng)導(dǎo)人的各項(xiàng)醫(yī)學(xué)數(shù)據(jù)就是密封后拿到美國去“確診”的。當(dāng)時(shí)美國有世界上最完整的醫(yī)療數(shù)據(jù),中國還沒有建立起來。有了這樣的醫(yī)學(xué)數(shù)據(jù),一位患者的所有身體數(shù)據(jù)只要輸入大數(shù)據(jù)庫后,基本上可以百分之百的確診??上н@樣的醫(yī)學(xué)大數(shù)據(jù)至今還沒有使用在普通患者身上,否則,就不會(huì)有誤診,世界上每年估計(jì)至少少死上百萬患者。
我再舉個(gè)例子,一位“婚姻咨詢專家”(以及古代的“媒婆”)通過自己的經(jīng)驗(yàn)和觀察,大致可以判斷出某對(duì)男女是否適合生活在一起,某種狀況下的夫妻是否可以保持婚姻白頭到老,大家都相信Ta的經(jīng)驗(yàn)和判斷,Ta于是就成了婚姻咨詢專家了??墒牵琓a的經(jīng)驗(yàn)是從哪里來的?是否全面?有沒有比他更靠譜的分析方法?
在大數(shù)據(jù)時(shí)代,有一個(gè)更簡單有效的辦法,足足可讓所有的婚姻專家變成“磚家”:通過對(duì)全球男女戀人成功率的統(tǒng)計(jì),以及離婚夫妻狀態(tài)的統(tǒng)計(jì),得出哪些人可以生活在一起,具有哪些特征夫妻大概七年左右就會(huì)離婚等等。在大數(shù)據(jù)時(shí)代,如果得到婚姻登記處與民政部門、NGO的協(xié)助,這樣的數(shù)據(jù)庫并不難建立起來。雖然總有特例,但通過對(duì)全球婚姻數(shù)據(jù)庫搜索后得出的結(jié)論,恐怕是八九不離十吧?
如此大范圍的對(duì)數(shù)據(jù)的收集、統(tǒng)計(jì)與歸類,在歷史上任何時(shí)代都是不可思議的。當(dāng)時(shí)沒有可以完成云計(jì)算的電腦,全部人類加在一起,也無法完成現(xiàn)在計(jì)算機(jī)可以獨(dú)立完成的計(jì)算,所以在歷史上,我們需要熟悉普遍規(guī)律、懂得邏輯、精通因果關(guān)系經(jīng)驗(yàn)豐富的專家們?yōu)槲覀兣艖n解難。
可到了“大數(shù)據(jù)”時(shí)代,這些“專家”如果意識(shí)不到時(shí)代不同了,就往往容易淪為“磚家”。這并非他們做得不夠好,而是對(duì)數(shù)據(jù)的利用,對(duì)各種數(shù)據(jù)的計(jì)算方式都發(fā)生了革命性的變化。
“公知”與“意見領(lǐng)袖”同樣遭到時(shí)代帶來的困境。我舉個(gè)自己的例子,我走過一百多個(gè)國家,還在多個(gè)國家定居過,如果是在古代,我去寫游記之類的,即便不是徐霞客,也能混個(gè)馬可波羅當(dāng)當(dāng)吧?即便在當(dāng)今,恐怕也沒幾個(gè)年輕人有我這樣的經(jīng)歷。
但實(shí)際上,我根本不敢寫游記,因?yàn)槲覍懭魏我粋€(gè)地方,都有至少幾百個(gè)中國網(wǎng)友去過(且比我觀察得更仔細(xì)),更不用說那個(gè)地方的居民還能在幾個(gè)小時(shí)之內(nèi)看到我的“游記”,在我的字里行間進(jìn)行檢查與百般挑剔。如果馬可波羅與徐霞客活在今天,他們的文字會(huì)立馬淹沒在大數(shù)據(jù)里。
“意見領(lǐng)袖”在互聯(lián)網(wǎng)興起的前幾年與博客、微博剛剛出現(xiàn)的時(shí)候可以做到呼風(fēng)喚雨,盛極一時(shí),主要是因?yàn)樗麄儽容^聰明,能夠抓住這些新科技的特點(diǎn),新瓶裝舊酒,加上網(wǎng)民與大眾一時(shí)還沒回過神來。過了幾年回頭看,你就會(huì)發(fā)現(xiàn),有幾個(gè)“意見領(lǐng)袖”在過去十年里真正推出一條真正屬于他們的意見?包括那些段子有笑話,有幾條不是從人類已有的幽默笑話中改頭換面山寨過來的?
我以前說過,我的任何一篇,如果沒有一個(gè)新的觀點(diǎn)或者一兩句獨(dú)特的句子與語錄,我是不會(huì)下筆的,可現(xiàn)在呢?我可不敢說了,垂手可得的海量信息,任何人都只不過是滄海一粟而已。每次演講,我講到得意之處,就常常提醒自己坐在下面正在玩手機(jī)的孩子們,他們可隨時(shí)會(huì)百度甚至谷歌我剛才的“名言”,從而有可能發(fā)現(xiàn)我其實(shí)是從人家的名言改編而來的。
對(duì)于網(wǎng)上活躍的“專家”,意見領(lǐng)袖與公知來說,成也互聯(lián)網(wǎng)、敗也互聯(lián)網(wǎng)。互聯(lián)網(wǎng)剛剛出現(xiàn)時(shí),幾乎成了名利場,最早從一篇博文可以一夜出名、扭動(dòng)一下屁股可以粉絲上百萬、講幾個(gè)段子就變成思想者,到后來甚至一條微博就可以讓你立馬被幾百萬人記住名字,這一切都讓魯迅、胡適那些寫了一輩子的文人墨客羨慕嫉妒恨。
當(dāng)然,好景不長。當(dāng)網(wǎng)民都回過神來,當(dāng)科技進(jìn)一步發(fā)展,當(dāng)“大數(shù)據(jù)”的威力逐漸發(fā)揮出來之后,一夜成名的互聯(lián)網(wǎng)又變得可以在一天之內(nèi)把任何一個(gè)不知天高地厚的家伙拋到九霄云外的地步。
在信息如此多樣與日漸公開的時(shí)代,那些還靠所在單位的光環(huán)和幾本書本知識(shí)以及兩本可疑的文憑來充當(dāng)“專家”的學(xué)者們,轉(zhuǎn)眼之間就成了“磚家”,遭人嘲笑;那些平時(shí)放松學(xué)習(xí)、停止獲得新知識(shí)卻還總想指點(diǎn)江山的“意見領(lǐng)袖”注定會(huì)被拋棄;而那些還幻想這是一個(gè)傳統(tǒng)媒體時(shí)代的知識(shí)份子們,則會(huì)讓“公知”越來越成為負(fù)面的詞匯。
“意見領(lǐng)袖”、“公知”與各類“專家”只不過是“大數(shù)據(jù)”時(shí)代的第一批“受害者”而已,“大數(shù)據(jù)”時(shí)代對(duì)政治、經(jīng)濟(jì)與社會(huì)的影響還遠(yuǎn)沒有展開。總體來說,“大數(shù)據(jù)”就是大公開、大透明、大民主的時(shí)代,只要“數(shù)據(jù)”不是掌握在少數(shù)人手里(或政府手里),遲早會(huì)發(fā)揮我們想象不到的威力。從這個(gè)意義上說,那些宣稱要啟蒙民眾、引領(lǐng)社會(huì)的“意見領(lǐng)袖”、“公知”與各類“專家”難道不應(yīng)該為自己的“失敗”而高興?“大數(shù)據(jù)”有可能完成千百代知識(shí)分子與專家們想做而無法做成的事。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11