
數(shù)據(jù)、大數(shù)據(jù)及其本質(zhì)是什么
最近幾年,數(shù)據(jù)問(wèn)題進(jìn)入哲學(xué)視野。對(duì)于哲學(xué)家們探索的數(shù)據(jù)本質(zhì)特征,我們可以從以下幾個(gè)方面來(lái)把握。
數(shù)據(jù)與大數(shù)據(jù)
技術(shù)進(jìn)步,主要是計(jì)算機(jī)、網(wǎng)絡(luò)和各種類型的傳感器以及云技術(shù)、分布式計(jì)算與存儲(chǔ)等海量存儲(chǔ)技術(shù)的廣泛應(yīng)用和運(yùn)算能力極速進(jìn)步,使得數(shù)據(jù)概念被大數(shù)據(jù)概念取代。數(shù)據(jù)量增加速度之快,大致可以這樣描述:最近兩年生成的數(shù)據(jù)量,相當(dāng)于此前一切時(shí)代人類所生產(chǎn)的數(shù)據(jù)量的總和。
大數(shù)據(jù)指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無(wú)法通過(guò)人工,在合理時(shí)間內(nèi)達(dá)到截取、管理、處理、并整理成為人類所能解讀的信息。大數(shù)據(jù)的特征,除了巨大、快速、多樣多變之外,沒(méi)有其他。因此,大數(shù)據(jù)本質(zhì)上還是數(shù)據(jù)。
在大數(shù)據(jù)的上述特征中,其多樣多變性值得特別關(guān)注。它表現(xiàn)為所生成數(shù)據(jù)格式的多樣,如文字、圖片、視頻等各有多種不同的格式,取決于生成數(shù)據(jù)的技術(shù)與設(shè)備,卻反映出數(shù)據(jù)生產(chǎn)的時(shí)代性以及數(shù)據(jù)處理的能力與條件,也反映出被描摹自然和社會(huì)的多姿多彩。另外,隨著技術(shù)發(fā)展和數(shù)據(jù)量急劇增長(zhǎng),新的數(shù)據(jù)格式還會(huì)層出不窮,多變和多樣特征更加突出。
大數(shù)據(jù)既是一個(gè)技術(shù)概念,又是一個(gè)商業(yè)概念,它的出現(xiàn),有其特定背景,即it領(lǐng)域的商業(yè)和渲染新技術(shù)的考量。大數(shù)據(jù)包攬了人類獲取數(shù)據(jù)的所有途徑,提示哲學(xué)研究一個(gè)全新時(shí)代的到來(lái),這個(gè)時(shí)代的先聲,很久遠(yuǎn)之前就已經(jīng)響起,那時(shí),它僅僅被稱作數(shù)據(jù)。在我們的討論中,主要考慮數(shù)據(jù)與哲學(xué)的關(guān)聯(lián)。
數(shù)據(jù)與認(rèn)識(shí)
這里的認(rèn)識(shí),指的是人的認(rèn)識(shí),是人對(duì)外部世界的認(rèn)識(shí)。
大數(shù)據(jù)的出現(xiàn)和引起關(guān)注,使得一個(gè)事實(shí)得到確認(rèn),這就是,數(shù)據(jù)覆蓋了人類對(duì)于外部世界的感知。感官及其所獲得的經(jīng)驗(yàn)退居到顯示屏之后,退居到各種類型的技術(shù)裝置之后,這些裝置將自然和外部世界的映像“轉(zhuǎn)譯”成人類感官可以接受的圖像、聲音甚至觸覺(jué)和嗅覺(jué)味覺(jué)。這既是技術(shù)發(fā)展的必然,又是始料未及的情況。如果說(shuō),此前,哲學(xué)還試圖在技術(shù)系統(tǒng)生成的數(shù)據(jù)之外尋找世界的直觀映像,到了大數(shù)據(jù)時(shí)代,這種人類的直接感知即使沒(méi)有被完全取代,也失去了其傳統(tǒng)意義上的優(yōu)勢(shì)。一言以蔽之,哲學(xué),需要從數(shù)據(jù)中尋求對(duì)世界的認(rèn)識(shí),舍此即失去認(rèn)識(shí)的來(lái)源。
這似乎是一個(gè)驚人的變故,其實(shí)不然。在影響人類認(rèn)識(shí)的議題上,大數(shù)據(jù)帶來(lái)的變化,只是數(shù)量和范圍上的,并非根本意義上的改變。事實(shí)上,回顧歷史,我們發(fā)現(xiàn),我們的對(duì)外部世界的感知,從來(lái)都是依賴于某些技術(shù)裝置的,也就是說(shuō),人的認(rèn)識(shí),其實(shí)是通過(guò)數(shù)據(jù)獲得的。
最早的技術(shù)裝置,可能是直尺,它用于測(cè)量長(zhǎng)度,例如田畝;更早的述說(shuō)技術(shù)裝備,也許是繩結(jié),它用來(lái)述說(shuō)一件重要的事件。在我國(guó),從河北泥河灣先民打造石器,到安陽(yáng)殷墟龜甲上刻畫的文字,都可以看作是某種“數(shù)據(jù)”,表達(dá)著人類對(duì)外部世界的某種認(rèn)知。而面對(duì)著所有這些早期的承載數(shù)據(jù)的技術(shù)裝備,人們獲得對(duì)外部世界的某種最早的抽象認(rèn)識(shí)。古代人先后發(fā)明過(guò)算籌、斗和稱、漏刻、渾象儀、量角器等等,無(wú)不是用來(lái)產(chǎn)生認(rèn)知外部世界的數(shù)據(jù),人們也發(fā)明筆、紙張、雕版印刷術(shù),也是用來(lái)記錄和生產(chǎn)數(shù)據(jù)。依托所有這些,數(shù)據(jù)成為人們認(rèn)識(shí)的依據(jù),思考的源泉,表達(dá)的工具。
近代以來(lái),西方的技術(shù)和科學(xué)異軍突起,望遠(yuǎn)鏡、顯微鏡、六分儀、光譜儀、質(zhì)譜儀乃至加速器、射電望遠(yuǎn)鏡相繼出現(xiàn),成為人類認(rèn)識(shí)外部世界的有力工具。這些技術(shù)裝備產(chǎn)生的數(shù)據(jù)成為近現(xiàn)代思想的新的依托。到了當(dāng)代,伴隨著電子計(jì)算機(jī)的強(qiáng)大數(shù)據(jù)處理能力的出現(xiàn),各種延伸和闊展人類感官感知能力的器皿設(shè)備層出不窮,終于完全或接近于完全取代人類對(duì)外部世界的直接感知,通過(guò)把數(shù)據(jù)呈現(xiàn)給人類,成為人類認(rèn)識(shí)的來(lái)源。這就是大數(shù)據(jù)的時(shí)代。
關(guān)鍵點(diǎn)在于,我們所知的世界,全部是數(shù)據(jù)表達(dá)的,其中一部分獲得理解和解釋,更多的只是數(shù)據(jù),沒(méi)有得到解釋甚至沒(méi)有得到關(guān)注,它只是像自在自然那樣在那里,等待人們?nèi)ニ阉靼l(fā)現(xiàn)它,解釋它,運(yùn)用它。
數(shù)據(jù)與本體
根據(jù)上述認(rèn)識(shí),似乎可以通過(guò)觀察數(shù)據(jù)的形成和生產(chǎn),來(lái)理解哲學(xué)與科學(xué)的在解釋客觀自然議題上彼此消長(zhǎng)。
在近代科學(xué)初興時(shí)期,它并沒(méi)有從傳統(tǒng)哲學(xué)中分離出來(lái),它被冠之以自然哲學(xué)。與之相并行不悖的,有哲學(xué)本體論和形而上學(xué)。后兩者都是試圖以某些觀念描述和解釋外部自然,尋求事物的本質(zhì),并在哲學(xué)領(lǐng)域合法存在。伽利略、牛頓等人推崇的使用先進(jìn)觀測(cè)和實(shí)驗(yàn)手段觀察與調(diào)控自然,用數(shù)學(xué)述說(shuō)自然過(guò)程。當(dāng)這一切成為風(fēng)氣之后,哲學(xué)本體論逐漸衰退,哲學(xué)似乎放棄了對(duì)客觀世界的描驀和解釋,讓位于自然科學(xué)。
最后一位試圖運(yùn)用科學(xué)數(shù)據(jù)來(lái)解釋自然的哲學(xué)家是康德,他研習(xí)了牛頓的運(yùn)動(dòng)力學(xué)和天體力學(xué),提出宇宙演化學(xué)說(shuō)。然而,拉普拉斯在康德基礎(chǔ)上,用物理理論和數(shù)學(xué)表述了星云說(shuō),在無(wú)限時(shí)空中的恒星和星系演化學(xué)說(shuō)。拉普拉斯之后,科學(xué)之描摹自然優(yōu)越于傳統(tǒng)哲學(xué)得到公認(rèn)。
一般認(rèn)為,在經(jīng)典科學(xué)時(shí)代,哲學(xué)與科學(xué)在描摹自然方面的差異,在于是否運(yùn)用數(shù)據(jù)和使用數(shù)學(xué)方法。今天我們發(fā)現(xiàn),這并非全部問(wèn)題所在。經(jīng)典時(shí)代,直至大數(shù)據(jù)崛起的今天,自然科學(xué)的確在使用各種技術(shù)裝備獲得的數(shù)據(jù)方面占據(jù)優(yōu)勢(shì)地位,哲學(xué)則固守傳統(tǒng)的概念分析和一般推理方法,這還是指的好的哲學(xué)。這與其說(shuō)是哲學(xué)落后于科學(xué),勿寧說(shuō)人類獲得數(shù)據(jù)的能力尚有不逮,給傳統(tǒng)哲學(xué)留有施展余地。
大數(shù)據(jù)的出現(xiàn),包圍了人類認(rèn)知世界的所有方面,情況發(fā)生變化。在科學(xué)界開始討論并實(shí)施“計(jì)算一切”的時(shí)候,同時(shí)也給哲學(xué)重新回到討論本體打開方便之門。這里發(fā)生的變化是,數(shù)據(jù)成為認(rèn)知的源泉,思維的質(zhì)料;我們對(duì)世界的解釋轉(zhuǎn)變?yōu)閷?duì)數(shù)據(jù)的解讀,舍此無(wú)他。大數(shù)據(jù)的出現(xiàn),使得我們發(fā)現(xiàn),我們所知的稱作外部世界的東西,是通過(guò)數(shù)據(jù)來(lái)呈現(xiàn)的,當(dāng)我們尋求世界的本質(zhì)和意義時(shí),我們實(shí)際上是在數(shù)據(jù)中徜徉;當(dāng)我們覺(jué)得有所發(fā)現(xiàn)有所體悟時(shí),實(shí)際上是自覺(jué)找到了一些數(shù)據(jù)之間的關(guān)聯(lián)。
數(shù)據(jù)的物理學(xué)氣質(zhì)
所謂物理學(xué)氣質(zhì),指的是思考事物的本質(zhì),從原理層面上對(duì)事物的本質(zhì)進(jìn)行探究,揭示出事物的基本規(guī)律。當(dāng)前備受熱議的數(shù)據(jù)和大數(shù)據(jù)是否具有揭示事物基本規(guī)律的功能,可能還有待于觀察,但是,數(shù)據(jù),就其現(xiàn)象而言,似乎已經(jīng)展示出某種物理學(xué)氣質(zhì),考察這一特性,既有利于認(rèn)識(shí)數(shù)據(jù)的本質(zhì),也有利于深化對(duì)物理學(xué)的認(rèn)識(shí)。
這里所說(shuō)的物理學(xué),主要指的是量子力學(xué)。
眾所周知,量子力學(xué)無(wú)論在理論上還是在應(yīng)用上都獲得巨大成功,在場(chǎng)論、粒子物理和天體物理學(xué)研究上都扮演者基礎(chǔ)角色,在固體物理、半導(dǎo)體物理以及超導(dǎo)物理等應(yīng)用學(xué)科上都有極出色表現(xiàn)。量子力學(xué)與哲學(xué)的聯(lián)系,比其他任何自然科學(xué)領(lǐng)域都要來(lái)得緊密,其中最重要的就是認(rèn)識(shí)論問(wèn)題。
量子力學(xué)發(fā)現(xiàn),建立在測(cè)不準(zhǔn)關(guān)系基礎(chǔ)上的認(rèn)識(shí),受到基本物理原理的限制,客觀世界原則上不可能真正被觀察到,我們只能根據(jù)物理測(cè)量結(jié)果認(rèn)識(shí)世界。而測(cè)量本身形成對(duì)客觀世界的干擾,導(dǎo)致無(wú)法真正認(rèn)清它的本來(lái)面目。所以,我們對(duì)于世界的認(rèn)識(shí),唯一來(lái)源就是測(cè)量的結(jié)果,即所謂經(jīng)驗(yàn)。
量子力學(xué)的這一認(rèn)識(shí)原則引發(fā)將近一百年的討論,至今未能平息。
尼爾斯·玻爾認(rèn)為我們必須接受量子力學(xué)給出的認(rèn)識(shí)原則,承認(rèn)和接受自然作出的安排,量子力學(xué)已經(jīng)很好地描繪了自然;愛(ài)因斯坦則不愿接受玻爾的“綏靖哲學(xué)”,他覺(jué)得一定是量子力學(xué)本身的不完備造成,人對(duì)自然的認(rèn)識(shí)應(yīng)該是能夠窮盡的,不可能也不應(yīng)該像量子力學(xué)所描繪的那樣。
當(dāng)我們回顧前述數(shù)據(jù)與大數(shù)據(jù)的認(rèn)識(shí)論與本體論含義時(shí),就明白,一直以來(lái)有關(guān)量子力學(xué)問(wèn)題的爭(zhēng)論,本質(zhì)上就是對(duì)于數(shù)據(jù)的意義的爭(zhēng)論。顯然,愛(ài)因斯坦不愿意接受數(shù)據(jù)給出的結(jié)果,以及對(duì)于數(shù)據(jù)的解釋,而玻爾則認(rèn)為數(shù)據(jù)揭示的自然正是自然本體,無(wú)論我們是不是喜歡它。
有趣的是,人們一直在爭(zhēng)論量子力學(xué)的測(cè)量問(wèn)題,此前卻幾乎從來(lái)沒(méi)有人意識(shí)到測(cè)量的結(jié)果本身就是數(shù)據(jù),而數(shù)據(jù)已經(jīng)成為事實(shí)上的認(rèn)識(shí)來(lái)源。離開數(shù)據(jù),我們對(duì)于世界一無(wú)所知。
在這個(gè)大數(shù)據(jù)時(shí)代,當(dāng)我們認(rèn)識(shí)到,數(shù)據(jù)正是我們認(rèn)識(shí)世界的源泉,所謂世界其實(shí)就是數(shù)據(jù)構(gòu)成的,我們也會(huì)看到數(shù)據(jù)本身所具有的物理學(xué)氣質(zhì),正像量子力學(xué)所強(qiáng)調(diào)的那樣,世界隱藏在經(jīng)驗(yàn)表象背后,我們所能談?wù)摰?,只是?jīng)驗(yàn)本身。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10