
大數(shù)據(jù)與認(rèn)識論一、主體與對象
傳統(tǒng)認(rèn)識論的認(rèn)識主體是個人,或者基本上屬于同一個“共同體”,具有相同或相似的“范式”的團(tuán)隊。近年來,越來越多的情況是,一方以種種方式委托另一方來認(rèn)識某個對象,如咨詢、課題,以及知識流程外包等,認(rèn)識的意向方與實施方分離,分為甲方和乙方。知識外包是在擁有相當(dāng)不同范式的各異的共同體之間。為完成甲方的特殊需求,乙方需編寫特殊的程序和軟件。相對而言,乙方和應(yīng)用互聯(lián)網(wǎng)大腦的人員具備專業(yè)的技術(shù)能力,委托方可以有特殊需求的科學(xué)家,更會有大量來自政府、企業(yè)界和社會的甲方,乙方需要相當(dāng)熟悉甲方的需求才有可能完成后者外包的事項,以及向甲方提供可視化的分析。因而主體在分化的同時緊密相關(guān)。
隨著認(rèn)識主體的分化,認(rèn)識的動機(jī)目的也發(fā)生相應(yīng)的變化?!靶】茖W(xué)”時代,認(rèn)識為了求真;“大科學(xué)”時代,認(rèn)識的動機(jī)承擔(dān)越來越多來自社會的需求,較之以往更有可能發(fā)生知識的“社會建構(gòu)”。大數(shù)據(jù)時代,“面對海量信息,任何人都只需要對自己有益和有用的信息”。一方面甲方的意圖帶有明顯目的性,另一方面,乙方因與甲方分離而較少利益相關(guān),有可能相對客觀冷靜地從事求真的研究。新的問題是:乙方如何判斷甲方所委托事項的合理性。只管求真的乙方是否可以因認(rèn)識主體的分離而免責(zé),可以不顧其中的倫理道德,有求必應(yīng)。在高度分化的認(rèn)識主體之間還需要有關(guān)系到責(zé)權(quán)利等事項細(xì)致妥貼的制度安排。簡言之,在大數(shù)據(jù)認(rèn)識論中,認(rèn)識主體高度分化并社會化。
從另一個角度看,大數(shù)據(jù)認(rèn)識論的認(rèn)識主體可以清晰地分為三個層次:政府、公司,以及個人,對應(yīng)于國家、市場和社會。政府由大數(shù)據(jù)把握全局;公司由大數(shù)據(jù)了解政府與個人的需求,理解相關(guān)政策,洞悉競爭對手,以及掌控資源。一個健全的社會擁有與政府和公司處于均衡狀態(tài)的個人。目前還看不到個人在大數(shù)據(jù)認(rèn)識論中作為主體的地位和作用??梢源_定的是,即使個人作為大數(shù)據(jù)認(rèn)識論的主體,其影響也與政府和公司不可同日而語。在這樣的層次中,馬爾庫塞曾經(jīng)批判的“單面人” 隱約可見。
相對而言,在大數(shù)據(jù)認(rèn)識論中,認(rèn)識對象的變化更具有根本性。傳統(tǒng)的認(rèn)識論所涉及的認(rèn)識對象是客觀存在,是“世界1”(包括被看作世界1的生物學(xué)意義上的人類),而大數(shù)據(jù)認(rèn)識論中的認(rèn)識對象既非世界1,亦非世界2對世界1的認(rèn)識結(jié)果亦即“世界3”(參見走進(jìn)世界3-知識論之一),而是世界2的宏觀表征。
大數(shù)據(jù)之所以得以成為研究對象,首先在于提供大數(shù)據(jù)的人和人際關(guān)系發(fā)生變化。近代以降,人是機(jī)器、單子,社會是由零件組裝而成可拆卸的機(jī)器。隨后,人是化工廠、細(xì)胞的王國,著眼點基本上都是單獨的個人,因而心理學(xué)的對象是獨立的個人。20世紀(jì)初,人“成長為”社會動物,個人的心理繞不過社會影響;反之,社會現(xiàn)象也需要下沉到個人心理予以說明;個人與社會難分難舍,其結(jié)果是,個人心理變幻莫測,社會現(xiàn)象雜亂無章。直到互聯(lián)網(wǎng)時代和功能各異的社交網(wǎng)站出現(xiàn)。社會軟件建立了一種新型的遠(yuǎn)程社會關(guān)系,從面對面地交往到數(shù)字操縱的交往,深刻地修改了已有的社會模式。“人類行為較之于相對獨立的個體決策行為發(fā)生了顯著變化,”構(gòu)建了某種“心有靈犀一點通”而又變動不居的人際間的相關(guān)性,使得數(shù)據(jù)不再雜亂無章,而是成為有規(guī)可循的大數(shù)據(jù),成為有價值的研究對象?!坝捎谀軌驕y得更準(zhǔn)、計算得更加精確,社會科學(xué)也正在脫下‘準(zhǔn)科學(xué)’的外衣,在21世紀(jì)全面邁進(jìn)科學(xué)的殿堂”。
在現(xiàn)象層面,作為對象的大數(shù)據(jù)有以下特征:首先是所謂“4V”,即數(shù)據(jù)量大(Volume),類型繁多(Variety),價值密度低 (Value),以及速度快時效高(Velocity);在深層是人類在大的時空尺度,也就是在個體不可比擬的量級所顯示出的前所未見的屬性。“揭示冗余度支持的有統(tǒng)計意義的情報及其關(guān)聯(lián),從大眾層面而不是個體層面來理解人類行為”。在某種程度上,大數(shù)據(jù)認(rèn)識論不是由個體層面理解人類行為,正如實驗心理學(xué)不是由單個腦細(xì)胞理解人的感知一樣。
正因為此,作為世界3的大數(shù)據(jù)在某種意義上具有與世界1一個同樣的特征:客觀性?!皞鹘y(tǒng)民調(diào)需要設(shè)計問卷,可能有意無意引入主觀因素,不能完全排除模糊歧義乃至誤導(dǎo)。大數(shù)據(jù)是自底而上的自動數(shù)據(jù)分析,用的是歸納整合的方法,因此更加具有客觀性。為了達(dá)成調(diào)查,調(diào)查者有時不得不施行物質(zhì)刺激,這也產(chǎn)生了部分客戶純粹為了獎勵而應(yīng)付調(diào)查、返回低質(zhì)問卷的弊端。自動民調(diào)的對象是民意的自然流露(水軍和惡意操縱另論),基數(shù)大,也有利于降噪,這就保障了情報的客觀性。”由此可以看出客觀性的三點依據(jù),其一即數(shù)據(jù)之大。這一點類似于所謂“主體間性”。顯然,兩三個人之間的主體間性與數(shù)以萬計個體的主體間性不可同日而語。昔日社會學(xué)的一大困惑在于數(shù)據(jù)不夠大,因而難以進(jìn)行客觀的研究。其二,數(shù)據(jù)之全,不僅是“二八定律”中的“二”,而且是“八”,也就是“長尾”,這就極大提升了普羅大眾在社會生活中的權(quán)重。不過,隨著“少數(shù)服從多數(shù)”成為現(xiàn)實,如何避免多數(shù)人的“暴政”,成為大數(shù)據(jù)時代有待解決的問題之一。其三,所謂 “自然流露”,也就是無意識。一方面,這種自然流露就是個體的主觀意識,另一方面,個體并不知曉其作為大數(shù)據(jù)認(rèn)識論的認(rèn)識對象。大數(shù)據(jù)的客觀,所需要的正是這樣的“主觀”。千萬個這樣相對純粹的主觀最終匯成客觀。就此而言,作為世界2宏觀表征的大數(shù)據(jù)可以歸入波普爾的“客觀知識”,也就是世界3。
作為認(rèn)識對象的大數(shù)據(jù)所呈現(xiàn)出整體上的特定關(guān)系,可以借用“漩渦與人性” 的隱喻來說明這一點。網(wǎng)友評論說,如果把水分子用納米碳管來輸運,一樣會出現(xiàn)“整體的擁堵”;反之,如果樓梯足夠?qū)?,人類下樓,怎么也不會出現(xiàn)這個擁堵。宏觀流體定律基于最小顆粒尺度與所考慮的尺度相比可以忽略。在大數(shù)據(jù)里,個人相當(dāng)于旋渦中的水分子,其“毛糙”(李德毅)的邊緣和瞬間的變化可以忽略。由此再次可見,數(shù)據(jù)之“大”的關(guān)鍵地位。
大數(shù)據(jù)不僅具有“4V”的特征,而且處于不斷增長之中。人類存在一天,大數(shù)據(jù)就與日俱增,永不枯竭。人們對于“物質(zhì)無限豐富”尚有爭論,至少還需要做一番解釋,對于大數(shù)據(jù),似乎甫一問世,即已是無限,乃至需要培育“刪除”和“忘卻”的“美德”(參見《刪除:大數(shù)據(jù)取舍之道》——《互聯(lián)網(wǎng)時代》觀后4)。無限的大數(shù)據(jù)或?qū)⒂兄诮鉀Q資源的短缺,讓有限的資源用到刀口上。
主體與對象的特殊關(guān)系也是大數(shù)據(jù)認(rèn)識論與傳統(tǒng)認(rèn)識論的一個值得注意的不同點。其一,由于在大數(shù)據(jù)的背后是處于群體中的毫不知情的人,是眾多社會關(guān)系的“總和”,于是認(rèn)識主體譬如說某家公司,面對握有的大數(shù)據(jù)便有如同上帝俯視蕓蕓眾生之感,認(rèn)識主體與對象之間成為牧羊人與羊的關(guān)系,“羊”的隱私在 “牧羊人” 那里透明。此外,相應(yīng)于認(rèn)識主體的三個層次,自然也就有作為對象的不同數(shù)據(jù)。無疑,政府所面對的數(shù)據(jù)最“大”,公司次之。不過,跨國公司認(rèn)識對象之大完全可能超過不少國家。個人所能夠認(rèn)識的數(shù)據(jù)在大小、內(nèi)容和性質(zhì)上均不可與政府與公司手上的數(shù)據(jù)同相提并論。個人以其數(shù)量之大,以及彼此間無意識的主體間性來平衡政府和公司。
其二,上帝會滿足于“俯視”,有人則把對數(shù)據(jù)的占有和控制看作是在陸權(quán)、海權(quán)、空權(quán)之外的另一種國家核心資產(chǎn)。這一點在斯諾登所曝光的“棱鏡” 中得到充分顯示。IBM執(zhí)行總裁羅睿蘭則認(rèn)為,“數(shù)據(jù)將成為一切行業(yè)當(dāng)中決定勝負(fù)的根本因素,最終數(shù)據(jù)將成為人類至關(guān)重要的自然資源?!贝髷?shù)據(jù)既可能“成為人類至關(guān)重要的自然資源”,也可能成為“另一種國家核心資產(chǎn)”。誰對大數(shù)據(jù)擁有產(chǎn)權(quán),甚至主權(quán)?傳統(tǒng)認(rèn)識論以世界1為對象,世界1對任何人一視同仁,因而在認(rèn)識論上并沒有所有權(quán)之爭,所有權(quán)主要是在實踐層面,在應(yīng)用領(lǐng)域。在大數(shù)據(jù)認(rèn)識論中,所有權(quán)進(jìn)入到認(rèn)識層面。在這一點上,大數(shù)據(jù)不同于世界3。個人、公司、國家可以獨自開發(fā)、獨占其中的一部分。大數(shù)據(jù)不僅具有認(rèn)識價值,而且擁有因人而異的使用價值。所謂的“計算社會科學(xué)”可能會變成私人公司和政府機(jī)構(gòu)的專屬領(lǐng)域,或許會出現(xiàn)占有私有數(shù)據(jù)的特權(quán)學(xué)術(shù)研究群體,無助于公眾利益。美國倫理審查委員會委員(U.S. Institutional Review Boards)認(rèn)為,必須增強(qiáng)技術(shù)知識來了解產(chǎn)生侵權(quán)和個人傷害的可能性,因為新的危害的產(chǎn)生條件不同于現(xiàn)存的模式。
其三,由此可以還引出一點,那就是技術(shù)手段在大數(shù)據(jù)認(rèn)識論中的極端重要性。棱鏡表明,技術(shù)手段可以用于發(fā)現(xiàn)、開發(fā)大數(shù)據(jù),挖掘大數(shù)據(jù)中的金礦,以及在于控制和支配。由此可見,在大數(shù)據(jù)認(rèn)識論中,技術(shù)比以往任何時候發(fā)揮更大的作用。對此有必要引起高度重視。“大數(shù)據(jù)時代,技術(shù)的有效性要比科學(xué)的完整性更重要!”
大數(shù)據(jù),受到技術(shù)手段和權(quán)力的制約和影響。技術(shù)在于開發(fā),關(guān)系到作為對象的大數(shù)據(jù)之大、之深,以及之利;權(quán)力在于選擇、控制與支配,控制大數(shù)據(jù)的種類、以及透明和共享的程度,并由此支配放牧的羊。雖然主體與對象在一定程度上可以互易,此時此地的主體在另一個場合可能就成為他人的對象,不過,擁有更先進(jìn)技術(shù)手段和更大權(quán)力者無疑更會是牧羊人。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03