
大數(shù)據(jù)時代知識的停止點_數(shù)據(jù)分析師考試
毫無疑問,信息超載作為一種生活方式,已經(jīng)挾裹著眾生的生活。戴維·溫伯格《知識的邊界》所嘗試的,恰是在大數(shù)據(jù)時代,如何認知網(wǎng)絡下的知識與科學。因為,不管確定“互聯(lián)網(wǎng)+”,還是定義“互聯(lián)網(wǎng)-”,都要面對今日“事實不再是事實”,而“專家隨處可見”的現(xiàn)實。
顯然需要理清思路,理性面對這一切。你要學會像戴維一樣,冷靜地打著比方,包括以轉述的方式,向自己的見解緩步、輕松而去——
美國出版公司蘭登書屋的創(chuàng)始人之一貝內(nèi)特·瑟夫出版的一本書里就講過這么個奇聞軼事:
一天,《哈波斯》雜志的卡斯·坎菲爾徳在編輯部接待一位長相甜美卻個性堅決的婦女。這位女同胞很想討論她自己正在創(chuàng)作的第一本小說?!耙槐拘≌f應該是多長的篇幅?”她問道。
“這個問題沒有確切的答案,”坎菲爾德解釋道,“一些像《伊登·弗洛姆》這樣的小說,大概只有4萬字。而其他的小說,如《飄》,卻可能達到30萬字。”
“但,普通小說的平均長度大概是多少字?”婦女堅持問道。
“呃,我覺得大概是8萬字吧。”坎菲爾德回答。
婦女跳了起來,并歡呼著?!案兄x上帝!”她喊道?!拔业男≌f完結了!”
戴維轉述這則逸聞并不是讓大家簡單地笑上一笑。戴維想說的是,面對太多的信息而無法全部知道的事實,其實我們的戰(zhàn)略一直是建立一個知識的停止點(stopping points)系統(tǒng)。這是個很有效的方法,很實用于保存和交流知識的紙質(zhì)媒介。
戴維列舉的另一偉大實例同樣能說明問題。1836年,達爾文從“小獵犬號”航行歸來,完成了將促進他進化論理論的觀察。1838年,達爾文對自己的理論有了清晰的想法。1842年,他用鉛筆寫下了35頁的“骨架”,但沒有公開。1844年,他寫了189頁的手稿,沒有公開,但指示妻子,如果他死了就將手稿出版。接下來的15年,他研究了藤壺,出版了8本書,生了9個孩子,并且經(jīng)常和同事通信往來討論。他還開始了實驗科學。但他就是沒有出版自己的進化論。他似乎在等著什么?有一天他收到了年輕的博物學家阿爾弗雷德·羅素·華萊士寫來的一封信,此后華萊士又寄給了達爾文一份20頁的文稿,里面提到的理論和達爾文的進化論基本相似。達爾文萬分驚訝,他想成為這個理論的最早提出者,但不想欺騙華萊士,或者怕更為糟糕,讓自己看起來是竊取了華萊士的觀點。在聽取兩位親密同事意見后,1858年7月,倫敦林奈學會安排宣讀了華萊士的一篇文章,以及達爾文的兩篇文章。林奈學會在自己的雜志上刊發(fā)這些文稿后,達爾文才開始在科學家圈內(nèi)引起關注。這個鼓舞,讓達爾文經(jīng)過13個月的寫作,完成了不朽的《物種起源》。達爾文和華萊士的故事,后世有多種解讀。紙質(zhì)出版模式靜靜地塑造了科學,這是一個例子。同時,那個停止點,格外清晰。
傳統(tǒng)的知識是紙的意外產(chǎn)物。沒有什么時候,我們對紙的認識這么明確過。紙上的知識,紙上的科學,曾經(jīng)是一種出版的類型,它們經(jīng)過層層過濾,才能在紙上“行走江湖”。但今天,紙質(zhì)悄然換作網(wǎng)絡。在此背景下,如有達爾文和華萊士的故事上演,恐怕要重新演繹,且絕不會如此安安靜靜,按部就班,起承轉合。
能夠明確的是,權威在網(wǎng)絡化時代仍然會是一個停止點,但“權威已經(jīng)不再是一個主要由有資質(zhì)的人所構成、專門生產(chǎn)特級產(chǎn)品的特殊階層了”。相反,權威更多地是由功能性來定義,如你的體驗一般:權威是你在無數(shù)連接中訪問的那個最后一個頁面——是你決定不再繼續(xù)去點擊其他鏈接的那個頁面。
正如戴維所打的比方一樣:當知識變得網(wǎng)絡化之后,房間里最聰明的那位,已經(jīng)不是站在屋子前頭給我們上課的那位,也不是房間里所有人的群體智慧。房間里最聰明的人,是房間本身:是容納了其中所有的人與思想,并把他們與外界相聯(lián)連的這個網(wǎng)。換句話說,互聯(lián)網(wǎng)作為知識的基礎設施,本身并不擁有創(chuàng)造知識的實體要件,知識不存在于書籍之中,也不存在于頭腦之中,而是存在于網(wǎng)絡本身。
以下事實正越來越清晰:傳統(tǒng)的圖書在表達觀點的方式和呈現(xiàn)形態(tài)上,是將思想擠壓到一條狹長的小徑上,驅(qū)使讀者沿著這條小徑行進。網(wǎng)絡化時代,從最為純正的網(wǎng)絡意義上,它的開放姿態(tài),決定每個人都遭遇了網(wǎng)絡所帶來的心理顛覆——豐富性、鏈接、無需許可、公共性、未決性,但網(wǎng)絡化的知識和科學,會讓我們更加接近關于知識和科學的真理。但就在這浩若煙海之中,我們一樣要找到知識的停止點,在心里給它個飛吻。
網(wǎng)絡,如尼古拉斯·卡爾說的那樣,重裝了我們的大腦。在信息洪流之中,眾生得以不必焦慮,并能輕松自在地在網(wǎng)絡之上“笑傲江湖”的方式,或許是找到那一個個知識的停止點。從這個意義上,我們要再回看一下本文開始時戴維·溫伯格轉述的故事,大笑三聲,一起釋懷。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓練與驗證損失驟升:機器學習訓練中的異常診斷與解決方案 在機器學習模型訓練過程中,“損失曲線” 是反映模型學習狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11