
大數(shù)據(jù)賣的就是隱私_數(shù)據(jù)分析師考試
隨著互聯(lián)網(wǎng)技術(shù)更新?lián)Q代,數(shù)據(jù)的大規(guī)模采集和分析使用,已是人們生活的常態(tài)。高端分析算式的研發(fā),使抽取數(shù)據(jù)中藏著的有用信息成為現(xiàn)實。于是數(shù)據(jù)的魔力大放異彩,給我們帶來了夢寐以求的便利。例如,商家仿佛鉆進消費者肚子里的孫悟空,你才轉(zhuǎn)了個念頭,電腦和手機就奇跡般地開始推送相關(guān)的商品廣告了。真應(yīng)了那句老話:心想事成。當然,我們也添了許多聞所未聞的麻煩,比如剛接通一個免費WiFi,銀行賬戶信息就莫名其妙地泄露了。電視臺天天報道,告誡大家警惕。但在市場弄潮兒眼里,數(shù)據(jù)還有更為奇妙的神功,那就是取之不盡、用之不竭的廉價原材料——元數(shù)據(jù)。元數(shù)據(jù)追蹤著我們的生活,一刻不停又無處不在,仿佛一座座富礦,等待著算式處理、點石成金。多少人想挖掘這富礦……現(xiàn)在,終于打通了礦井,而那最后的爆破就是:數(shù)據(jù)商品化,公開合法的交易。
然而,要把數(shù)據(jù)交易這顆“明珠”穩(wěn)穩(wěn)當當?shù)胤派蠑?shù)據(jù)產(chǎn)業(yè)金字塔的頂端,尚有一道難題需要回答:數(shù)據(jù)要當做商品,它的所有權(quán)何在?
一樣?xùn)|西之成為商品,一是因為它有某種使用價值,如飲食、觀賞、制作工具等;二是因為有人拿它來買賣,即實現(xiàn)其可交換的價值。如此就有了價格和市場。一般來說,商品的產(chǎn)權(quán)清晰,買賣才做得成。明確的所有權(quán)(ownership)歸屬,是商品參與市場交易的前提條件,而所有權(quán)的界定有賴于一套穩(wěn)定的社會道德倫理和法律規(guī)范;否則就難以有效行使產(chǎn)權(quán),包括市場交易,并合理合法地解決相關(guān)的糾紛。顯然,數(shù)據(jù)作為商品,也不例外。不幸的是,信息時代雖然來臨,數(shù)據(jù)的財產(chǎn)所有權(quán)卻一直缺乏規(guī)范,滯留在法律的灰色地帶。因此,海量的數(shù)據(jù)掛牌交易,對于市場秩序和交易雙方,就充滿了法律風(fēng)險;而且,從社會公正的角度看,還極易損害被記錄主體的一些公民基本權(quán)利,包括人格權(quán)與財產(chǎn)權(quán),影響到民眾的醫(yī)保、生育、就業(yè)和人身自由權(quán)。為了降低并管控這些風(fēng)險,我們有必要研究一下數(shù)據(jù)所有權(quán)的歸屬,對數(shù)據(jù)商品化,即新產(chǎn)權(quán)的攫取和擴張可能帶來的社會后果考察一番。
數(shù)據(jù)的所有權(quán)到底該歸誰?如,你在網(wǎng)上購物生成的數(shù)據(jù),產(chǎn)權(quán)屬于網(wǎng)店、網(wǎng)上購物平臺提供商,還是你自己?患者就診,病史信息歸病人、醫(yī)院,還是醫(yī)院的電腦系統(tǒng)提供商?社保個人賬戶數(shù)據(jù),屬于參保者、政府、共同基金,抑或網(wǎng)絡(luò)系統(tǒng)外包商?這是回避不了的問題,現(xiàn)行法律規(guī)范和學(xué)說卻顯得捉襟見肘,拿不出有說服力又便于操作的答案。為什么呢?我們仔細思考便會發(fā)現(xiàn),那困境的起因,在于數(shù)據(jù)的不同尋常的價值特征,或者說,在于它正在獲得的市場新身份——商品。
數(shù)據(jù),若是指記錄下來的一組信息,并不是什么新鮮事。自人類發(fā)明了記錄工具和手段,如文字符號、紙張和硬盤,數(shù)據(jù)就一直伴隨著我們。歷史上,所有權(quán)不太受關(guān)注,是因為數(shù)據(jù)一般不會被當作商品,不參與市場交易;私下或非法的付費(如賄賂和諜報活動)不算?;ヂ?lián)網(wǎng)技術(shù)大規(guī)模開發(fā)了數(shù)據(jù)的價值,數(shù)據(jù)商品化,所有權(quán)問題才凸顯了。
作為商品,數(shù)據(jù)具有類似無形財產(chǎn)的特征,可以無限復(fù)制而無損耗;其所有權(quán)、許可使用、收益和轉(zhuǎn)讓,都依賴法律的保障。一般認為,無形財產(chǎn)的權(quán)屬界定有一個特點,初始所有權(quán)與財產(chǎn)的生成及價值起源掛鉤。例如,文學(xué)藝術(shù)作品的版權(quán)首先屬于作者,因為作品是通過作者的勞動才產(chǎn)生,并有了價值。同樣的素材,讓不同的作者來創(chuàng)作(包括集體創(chuàng)作),作品的內(nèi)容風(fēng)格可以千姿百態(tài)。這說明,作品蘊含了作者的思想人格。所以,現(xiàn)代法律才把無形財產(chǎn)的初始所有權(quán)視為創(chuàng)作的果實,并把作品價值歸于作者的人格和創(chuàng)造性勞動。恰恰在這一點上,數(shù)據(jù)與別的無形財產(chǎn)如版權(quán),分道揚鑣了。
我們知道,跟文藝創(chuàng)作和技術(shù)發(fā)明不一樣,數(shù)據(jù)的價值不是因記錄者的制作而起的。數(shù)據(jù)只有忠實于被記錄主體,準確反映后者的身份性格行為習(xí)慣等等,才具有價值。換言之,記錄下來的信息必須“無創(chuàng)見”、“非創(chuàng)新”,客觀得像一面鏡子,才有實用價值。不論血糖血脂的定期測量、消費習(xí)慣或借貸信用的曲線,還是網(wǎng)民訪問網(wǎng)頁的點擊數(shù)、氣候變化同糧食收成或公司營運的相關(guān)性數(shù)據(jù):脫離了具體的被記錄的人、物、事,數(shù)據(jù)是無意義、無價值也不能用的。不忠實的記錄如果不是疏忽,便是編造,是假數(shù)據(jù)??梢?,數(shù)據(jù)的全部價值,就在百分之百依附于被記錄主體,而不能剝離了獨立存在。于是,根據(jù)上述無形財產(chǎn)的一般原理,作品價值與初始所有權(quán)統(tǒng)一,數(shù)據(jù)所有權(quán)的生成(subsistence)應(yīng)是在被記錄主體。
這道理也符合我們的常識。比方說,同樣一套數(shù)據(jù),換一個人或一家公司記錄,或者換一臺電腦來處理、儲存,絲毫不會改變數(shù)據(jù)內(nèi)容。就數(shù)據(jù)的價值而言,誰來記錄和用什么工具記錄并不重要,重要的是被記錄的是誰、是什么。誠然,數(shù)據(jù)的采集整理離不開記錄者和記錄工具,乃至投資方的支持。但投資和采集整理產(chǎn)生的是次生的權(quán)利,動搖不了數(shù)據(jù)的初始所有權(quán)。因為數(shù)據(jù)從屬于被記錄主體,兩者不可分離,是數(shù)據(jù)價值的所在。而記錄者及其工具手段與數(shù)據(jù)內(nèi)容的關(guān)系則是松散的、可置換的,不是數(shù)據(jù)價值的起源。故而數(shù)據(jù)的初始財產(chǎn)權(quán)屬于被記錄主體,不僅有學(xué)理和社會道德的支持,落實在新產(chǎn)權(quán)的建設(shè)上,似乎也應(yīng)是權(quán)利配置的“自然”選擇。
不過,學(xué)理歸學(xué)理,現(xiàn)實世界里大數(shù)據(jù)的監(jiān)管,法律法規(guī)才剛起步,不太給力。這里涉及大數(shù)據(jù)的另一個特征:所有權(quán)人同記錄者 / 占有者的分離,即數(shù)據(jù)的財產(chǎn)所有權(quán)人一般不是數(shù)據(jù)的記錄和持有者——所有權(quán)人非但不占有數(shù)據(jù),連接觸、支配自己的數(shù)據(jù)財產(chǎn)也很困難。平常所謂財產(chǎn)問題,財產(chǎn)或者掌握在產(chǎn)權(quán)人手中,或者有明確的合同委托監(jiān)護,如房產(chǎn)、首飾、存款。至少,產(chǎn)權(quán)人知曉財產(chǎn)的存在和財產(chǎn)權(quán)的歸屬。產(chǎn)權(quán)人有意愿,且依法有能力,行使自己的權(quán)利。但是遇到數(shù)據(jù)財產(chǎn),情況就變了。例如,網(wǎng)店的交易雙方可能不清楚,自己的行為已經(jīng)被平臺提供方記錄在案,更無從了解是如何記錄的,放進了哪些數(shù)據(jù)集,會交付誰使用,怎樣使用。又如,互聯(lián)網(wǎng)搜索器記錄下的搜索行為的每一個細節(jié),用戶是無權(quán)訪問,也沒法監(jiān)督的。這就使得被記錄主體處于一個尷尬境地:他雖然擁有理論上的數(shù)據(jù)所有權(quán),實際上卻很難行使。反觀數(shù)據(jù)記錄者,盡管沒有初始產(chǎn)權(quán),卻因為擁有記錄工具和手段,就控制了記錄過程、內(nèi)容、格式和結(jié)果,把數(shù)據(jù)牢牢握在手中。而且,這法律意義上的受委托方,甩開了委托人 / 被記錄主體,成了數(shù)據(jù)的唯一持有者。更微妙的是,大數(shù)據(jù)以量取勝,孤立的單個數(shù)據(jù)幾乎沒有商品價值;故而多數(shù)被記錄主體容易忽視自己的數(shù)據(jù)產(chǎn)權(quán)。但是一個個數(shù)據(jù)集腋成裘,便是寶藏。而大型數(shù)據(jù)集的處理使用,須借助復(fù)雜的分析算式與大功率計算機,老百姓和小公司難以問津。漸漸地,大數(shù)據(jù)的采集整理,便成了財力雄厚的大公司的專利。產(chǎn)權(quán)人的疏忽或無力,即占有者的便利。后者往往隨意使用數(shù)據(jù),出了問題,后果也難以追究,包括數(shù)據(jù)丟失、黑市交易,更不要說個人隱私滿天飛了。這是大數(shù)據(jù)時代的一道世界性的難題。
正是意識到這種復(fù)雜性,數(shù)據(jù)產(chǎn)業(yè)才決定繞開所有權(quán),快刀斬亂麻:成立大數(shù)據(jù)交易所,掛牌交易,用既成事實“倒逼”社會和法律默許。推手希望通過交易所,給數(shù)據(jù)披上一件嶄新的外衣,遮住所有權(quán)上的瑕疵。同時,利用媒體開展宣傳攻勢,淡化對個人隱私和公共利益的威脅,聲稱:“交易所交易的不是底層數(shù)據(jù),而是清洗、分析、建模之后的數(shù)據(jù)結(jié)果?!保ㄒ姟顿F陽日報》2015年5月16日頭版)似乎經(jīng)過“清洗”,一下子解決了兩個敏感問題:一、數(shù)據(jù)集經(jīng)過清洗,遮蔽了身份信息,個人隱私、技術(shù)秘密等就能獲得保護;二、清洗過后,數(shù)據(jù)便擺脫了初始所有權(quán)而有了新的業(yè)主,可以合法交易了。但事實上,所謂“清洗” 并不等于“脫敏”。更重要的是,法理上,“清洗”這一技術(shù)手段不可能將“底層數(shù)據(jù)”的所有權(quán)轉(zhuǎn)移到所謂“數(shù)據(jù)結(jié)果”。就像拿了別人的珍珠項鏈,不會因為把珍珠拆下重新串過,項鏈變長變短,或者鑲在幾只胸針上,那些珍珠就變成自己的財產(chǎn),就可以合法出售。所以“清洗”只是回避問題的一種說法;那被回避的,才是數(shù)據(jù)商品化的要害所在:底層數(shù)據(jù)到底屬于誰?誰說了算?
所以不是偶然,最近美國多個農(nóng)會的一次聯(lián)合行動,正是這樣的質(zhì)問和拒絕“倒逼”。他們的立場與上述討論殊途同歸,我以為代表了國際潮流,體現(xiàn)了前沿社會在數(shù)據(jù)所有權(quán)歸屬及衍生權(quán)利范圍等問題上的基本共識。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
AI 浪潮下的生存與進階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導(dǎo)白皮書) 發(fā)布機構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認 ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準 ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04