
數(shù)據(jù)、大數(shù)據(jù)及其本質(zhì)是什么
最近幾年,數(shù)據(jù)問題進入哲學(xué)視野。對于哲學(xué)家們探索的數(shù)據(jù)本質(zhì)特征,我們可以從以下幾個方面來把握。
數(shù)據(jù)與大數(shù)據(jù)
技術(shù)進步,主要是計算機、網(wǎng)絡(luò)和各種類型的傳感器以及云技術(shù)、分布式計算與存儲等海量存儲技術(shù)的廣泛應(yīng)用和運算能力極速進步,使得數(shù)據(jù)概念被大數(shù)據(jù)概念取代。數(shù)據(jù)量增加速度之快,大致可以這樣描述:最近兩年生成的數(shù)據(jù)量,相當于此前一切時代人類所生產(chǎn)的數(shù)據(jù)量的總和。
大數(shù)據(jù)指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無法通過人工,在合理時間內(nèi)達到截取、管理、處理、并整理成為人類所能解讀的信息。大數(shù)據(jù)的特征,除了巨大、快速、多樣多變之外,沒有其他。因此,大數(shù)據(jù)本質(zhì)上還是數(shù)據(jù)。
在大數(shù)據(jù)的上述特征中,其多樣多變性值得特別關(guān)注。它表現(xiàn)為所生成數(shù)據(jù)格式的多樣,如文字、圖片、視頻等各有多種不同的格式,取決于生成數(shù)據(jù)的技術(shù)與設(shè)備,卻反映出數(shù)據(jù)生產(chǎn)的時代性以及數(shù)據(jù)處理的能力與條件,也反映出被描摹自然和社會的多姿多彩。另外,隨著技術(shù)發(fā)展和數(shù)據(jù)量急劇增長,新的數(shù)據(jù)格式還會層出不窮,多變和多樣特征更加突出。
大數(shù)據(jù)既是一個技術(shù)概念,又是一個商業(yè)概念,它的出現(xiàn),有其特定背景,即it領(lǐng)域的商業(yè)和渲染新技術(shù)的考量。大數(shù)據(jù)包攬了人類獲取數(shù)據(jù)的所有途徑,提示哲學(xué)研究一個全新時代的到來,這個時代的先聲,很久遠之前就已經(jīng)響起,那時,它僅僅被稱作數(shù)據(jù)。在我們的討論中,主要考慮數(shù)據(jù)與哲學(xué)的關(guān)聯(lián)。
數(shù)據(jù)與認識
這里的認識,指的是人的認識,是人對外部世界的認識。
大數(shù)據(jù)的出現(xiàn)和引起關(guān)注,使得一個事實得到確認,這就是,數(shù)據(jù)覆蓋了人類對于外部世界的感知。感官及其所獲得的經(jīng)驗退居到顯示屏之后,退居到各種類型的技術(shù)裝置之后,這些裝置將自然和外部世界的映像“轉(zhuǎn)譯”成人類感官可以接受的圖像、聲音甚至觸覺和嗅覺味覺。這既是技術(shù)發(fā)展的必然,又是始料未及的情況。如果說,此前,哲學(xué)還試圖在技術(shù)系統(tǒng)生成的數(shù)據(jù)之外尋找世界的直觀映像,到了大數(shù)據(jù)時代,這種人類的直接感知即使沒有被完全取代,也失去了其傳統(tǒng)意義上的優(yōu)勢。一言以蔽之,哲學(xué),需要從數(shù)據(jù)中尋求對世界的認識,舍此即失去認識的來源。
這似乎是一個驚人的變故,其實不然。在影響人類認識的議題上,大數(shù)據(jù)帶來的變化,只是數(shù)量和范圍上的,并非根本意義上的改變。事實上,回顧歷史,我們發(fā)現(xiàn),我們的對外部世界的感知,從來都是依賴于某些技術(shù)裝置的,也就是說,人的認識,其實是通過數(shù)據(jù)獲得的。
最早的技術(shù)裝置,可能是直尺,它用于測量長度,例如田畝;更早的述說技術(shù)裝備,也許是繩結(jié),它用來述說一件重要的事件。在我國,從河北泥河灣先民打造石器,到安陽殷墟龜甲上刻畫的文字,都可以看作是某種“數(shù)據(jù)”,表達著人類對外部世界的某種認知。而面對著所有這些早期的承載數(shù)據(jù)的技術(shù)裝備,人們獲得對外部世界的某種最早的抽象認識。古代人先后發(fā)明過算籌、斗和稱、漏刻、渾象儀、量角器等等,無不是用來產(chǎn)生認知外部世界的數(shù)據(jù),人們也發(fā)明筆、紙張、雕版印刷術(shù),也是用來記錄和生產(chǎn)數(shù)據(jù)。依托所有這些,數(shù)據(jù)成為人們認識的依據(jù),思考的源泉,表達的工具。
近代以來,西方的技術(shù)和科學(xué)異軍突起,望遠鏡、顯微鏡、六分儀、光譜儀、質(zhì)譜儀乃至加速器、射電望遠鏡相繼出現(xiàn),成為人類認識外部世界的有力工具。這些技術(shù)裝備產(chǎn)生的數(shù)據(jù)成為近現(xiàn)代思想的新的依托。到了當代,伴隨著電子計算機的強大數(shù)據(jù)處理能力的出現(xiàn),各種延伸和闊展人類感官感知能力的器皿設(shè)備層出不窮,終于完全或接近于完全取代人類對外部世界的直接感知,通過把數(shù)據(jù)呈現(xiàn)給人類,成為人類認識的來源。這就是大數(shù)據(jù)的時代。
關(guān)鍵點在于,我們所知的世界,全部是數(shù)據(jù)表達的,其中一部分獲得理解和解釋,更多的只是數(shù)據(jù),沒有得到解釋甚至沒有得到關(guān)注,它只是像自在自然那樣在那里,等待人們?nèi)ニ阉靼l(fā)現(xiàn)它,解釋它,運用它。
數(shù)據(jù)與本體
根據(jù)上述認識,似乎可以通過觀察數(shù)據(jù)的形成和生產(chǎn),來理解哲學(xué)與科學(xué)的在解釋客觀自然議題上彼此消長。
在近代科學(xué)初興時期,它并沒有從傳統(tǒng)哲學(xué)中分離出來,它被冠之以自然哲學(xué)。與之相并行不悖的,有哲學(xué)本體論和形而上學(xué)。后兩者都是試圖以某些觀念描述和解釋外部自然,尋求事物的本質(zhì),并在哲學(xué)領(lǐng)域合法存在。伽利略、牛頓等人推崇的使用先進觀測和實驗手段觀察與調(diào)控自然,用數(shù)學(xué)述說自然過程。當這一切成為風氣之后,哲學(xué)本體論逐漸衰退,哲學(xué)似乎放棄了對客觀世界的描驀和解釋,讓位于自然科學(xué)。
最后一位試圖運用科學(xué)數(shù)據(jù)來解釋自然的哲學(xué)家是康德,他研習(xí)了牛頓的運動力學(xué)和天體力學(xué),提出宇宙演化學(xué)說。然而,拉普拉斯在康德基礎(chǔ)上,用物理理論和數(shù)學(xué)表述了星云說,在無限時空中的恒星和星系演化學(xué)說。拉普拉斯之后,科學(xué)之描摹自然優(yōu)越于傳統(tǒng)哲學(xué)得到公認。
一般認為,在經(jīng)典科學(xué)時代,哲學(xué)與科學(xué)在描摹自然方面的差異,在于是否運用數(shù)據(jù)和使用數(shù)學(xué)方法。今天我們發(fā)現(xiàn),這并非全部問題所在。經(jīng)典時代,直至大數(shù)據(jù)崛起的今天,自然科學(xué)的確在使用各種技術(shù)裝備獲得的數(shù)據(jù)方面占據(jù)優(yōu)勢地位,哲學(xué)則固守傳統(tǒng)的概念分析和一般推理方法,這還是指的好的哲學(xué)。這與其說是哲學(xué)落后于科學(xué),勿寧說人類獲得數(shù)據(jù)的能力尚有不逮,給傳統(tǒng)哲學(xué)留有施展余地。
大數(shù)據(jù)的出現(xiàn),包圍了人類認知世界的所有方面,情況發(fā)生變化。在科學(xué)界開始討論并實施“計算一切”的時候,同時也給哲學(xué)重新回到討論本體打開方便之門。這里發(fā)生的變化是,數(shù)據(jù)成為認知的源泉,思維的質(zhì)料;我們對世界的解釋轉(zhuǎn)變?yōu)閷?shù)據(jù)的解讀,舍此無他。大數(shù)據(jù)的出現(xiàn),使得我們發(fā)現(xiàn),我們所知的稱作外部世界的東西,是通過數(shù)據(jù)來呈現(xiàn)的,當我們尋求世界的本質(zhì)和意義時,我們實際上是在數(shù)據(jù)中徜徉;當我們覺得有所發(fā)現(xiàn)有所體悟時,實際上是自覺找到了一些數(shù)據(jù)之間的關(guān)聯(lián)。
數(shù)據(jù)的物理學(xué)氣質(zhì)
所謂物理學(xué)氣質(zhì),指的是思考事物的本質(zhì),從原理層面上對事物的本質(zhì)進行探究,揭示出事物的基本規(guī)律。當前備受熱議的數(shù)據(jù)和大數(shù)據(jù)是否具有揭示事物基本規(guī)律的功能,可能還有待于觀察,但是,數(shù)據(jù),就其現(xiàn)象而言,似乎已經(jīng)展示出某種物理學(xué)氣質(zhì),考察這一特性,既有利于認識數(shù)據(jù)的本質(zhì),也有利于深化對物理學(xué)的認識。
這里所說的物理學(xué),主要指的是量子力學(xué)。
眾所周知,量子力學(xué)無論在理論上還是在應(yīng)用上都獲得巨大成功,在場論、粒子物理和天體物理學(xué)研究上都扮演者基礎(chǔ)角色,在固體物理、半導(dǎo)體物理以及超導(dǎo)物理等應(yīng)用學(xué)科上都有極出色表現(xiàn)。量子力學(xué)與哲學(xué)的聯(lián)系,比其他任何自然科學(xué)領(lǐng)域都要來得緊密,其中最重要的就是認識論問題。
量子力學(xué)發(fā)現(xiàn),建立在測不準關(guān)系基礎(chǔ)上的認識,受到基本物理原理的限制,客觀世界原則上不可能真正被觀察到,我們只能根據(jù)物理測量結(jié)果認識世界。而測量本身形成對客觀世界的干擾,導(dǎo)致無法真正認清它的本來面目。所以,我們對于世界的認識,唯一來源就是測量的結(jié)果,即所謂經(jīng)驗。
量子力學(xué)的這一認識原則引發(fā)將近一百年的討論,至今未能平息。
尼爾斯·玻爾認為我們必須接受量子力學(xué)給出的認識原則,承認和接受自然作出的安排,量子力學(xué)已經(jīng)很好地描繪了自然;愛因斯坦則不愿接受玻爾的“綏靖哲學(xué)”,他覺得一定是量子力學(xué)本身的不完備造成,人對自然的認識應(yīng)該是能夠窮盡的,不可能也不應(yīng)該像量子力學(xué)所描繪的那樣。
當我們回顧前述數(shù)據(jù)與大數(shù)據(jù)的認識論與本體論含義時,就明白,一直以來有關(guān)量子力學(xué)問題的爭論,本質(zhì)上就是對于數(shù)據(jù)的意義的爭論。顯然,愛因斯坦不愿意接受數(shù)據(jù)給出的結(jié)果,以及對于數(shù)據(jù)的解釋,而玻爾則認為數(shù)據(jù)揭示的自然正是自然本體,無論我們是不是喜歡它。
有趣的是,人們一直在爭論量子力學(xué)的測量問題,此前卻幾乎從來沒有人意識到測量的結(jié)果本身就是數(shù)據(jù),而數(shù)據(jù)已經(jīng)成為事實上的認識來源。離開數(shù)據(jù),我們對于世界一無所知。
在這個大數(shù)據(jù)時代,當我們認識到,數(shù)據(jù)正是我們認識世界的源泉,所謂世界其實就是數(shù)據(jù)構(gòu)成的,我們也會看到數(shù)據(jù)本身所具有的物理學(xué)氣質(zhì),正像量子力學(xué)所強調(diào)的那樣,世界隱藏在經(jīng)驗表象背后,我們所能談?wù)摰模皇墙?jīng)驗本身。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03