
大數(shù)據(jù)與個人信息保護
數(shù)據(jù)為王的時代,對于用戶隱私的保護必然會越來越受到重視。那么,個人隱私保護制度會對互聯(lián)網(wǎng)的發(fā)展帶來怎樣的影響?如何才能在大數(shù)據(jù)應用的商業(yè)利益與公眾的個人信息保護需求之間取得平衡?在互聯(lián)網(wǎng)無時不在、無時不有的今天,我們的隱私在各種情況下被收集、被利用,甚至被濫用,有關個人信息保護的立法也是國家立法計劃中的重要內容,我主要跟大家分享幾個方面,首先什么是隱私,如果這一點達不成共識,討論就沒有意義了。第二,我們現(xiàn)在所謂隱私保護面臨哪些問題?第三,面對這些問題,未來從法律上怎么解決這些問題?
隱私是一個法律概念
隱私簡單地說,是一個人不想讓別人知道的東西。但個人的生活、感情因人而異,大家對隱私的看法也不一樣。很多朋友都講,隱私體現(xiàn)的是一種個人的東西,這在我理解的話就是屬于個人信息的范疇。很多人對什么是隱私有分歧,就同一個人來說也不確定自己哪些是隱私,或者有些時候是,有些時候不是,完全自己說了算。所以這樣的社會里如果較起真來,或者在法律上要維權的話就混亂了。
隱私不是中國本土的概念,隱私是用美國隱私概念的瓶裝入了歐洲隱私的酒拿到中國來的。歐美人并沒有對隱私從不同的學科、不同的語境、不同的地域文化上做區(qū)分,在歐美問什么是隱私,分歧也很大,但可能會比中國好一些,因為這種隱私跟我們的文化水土不服。隱私是一個與地域文化傳統(tǒng)關聯(lián)十分密切的概念。
在歐洲,宗教信仰就是隱私,而在中國,誰會認為這是隱私呢?中國傳統(tǒng)上并沒有隱私的概念,有一個觀念是陰私。但上世紀70年代末80年代初,從歐美翻譯過來的隱私的概念傳到中國后廣泛傳播,導致了現(xiàn)在中國的隱私泛濫、泛化,動不動就說侵犯隱私,但你問什么是隱私,他卻無法給你準確的答案。
隱私應當做不同學科、不同語境、不同地域文化的理解。女性的三圍、身高、體重是心理學或社會學上的隱私,一定不能將這些隱私,包括政治學、經(jīng)濟學意義上的隱私跟法律上的隱私混為一談。法律上,隱私是通過隱私權來保護的,權利就是行為自由的邊界。這個邊界很清晰,其他人不能進入,否則就可以起訴他侵權。如果法律上的隱私內涵不確定、外延不明確,因人而異,就會出現(xiàn)混亂。
隱私與公共利益無關
隱私絕對是個人的東西,比如國家機關就沒有隱私。法律上的隱私,是個人信息的一部分,但不是所有個人信息都是法律上的隱私,姓名、家庭住址、女性的三圍絕對不是法律上所講的隱私。中國的陰私概念是值得借鑒的,從1956年“民法草案”開始,到1982年的民法通則,這一段時間里中國的法律上就有陰私概念。陰私是指不好的事情,一般正常理性的人,這些事情、信息公布出去會讓他名譽掃地,讓他的社會尊嚴受到傷害。傳統(tǒng)的陰私僅僅是指與性有關的一些東西,比如裸照、性生活、兩性情感。這個價值取向值得我們認可,但缺點是內涵比較窄,僅限于與性有關的方面。
陰私的價值觀我們要繼承。在上世紀70年代、80年代之前,陰私內涵比較窄沒有問題,但是發(fā)展到今天,價值取向擴大了。很多人認可隱私這個詞,這就是中國傳統(tǒng)陰私的概念,但是內容要擴展。所以法律上的隱私,不限于與性有關的,還包括不為人知的重大生理疾病缺陷,這些缺陷公布出去同樣會讓他受到歧視,或令他的名譽受到影響。
這里下一個定義,法律上的隱私是指與公共利益、社會利益沒有直接關系,同時又與人的名譽和尊嚴有關的極少數(shù)個人信息,這是抽象出來的本質;包括但不限于裸照、性相關、情感經(jīng)歷、生理疾病等,這是范圍和表象。很多學者批評中國民法通則沒有規(guī)范隱私,不重視人權,但是最高法院的司法解釋是把它作為名譽權來保護的,比如披露與性有關的東西,讓人名譽掃地,就認為侵犯了名譽權。其實按我的理解,隱私權不獨立,隱私與名譽是相聯(lián)系的。這方面中國其實比歐美先進,中國有陰私概念,披露陰私即會使人名譽掃地。
與公共利益、社會利益的關系還要看具體情況。一般人的婚外情或者是兩性的東西可能被認為是屬于隱私,但是作為政治官員、作為公眾人物,他們的某些個人信息可能與公共利益、社會利益有關系,所以這部分在一定范圍內可以公開。一般人認為屬于隱私的,他們要受到限制。但是無論如何,在披露這些政治人物或者公眾人物隱私時也要考慮到他們作為一個人最起碼的名譽和尊嚴,披露的方式要注意,比如將裸照放在網(wǎng)上是不可以接受的,不能因為是公眾人物就不被保護。再比如犯罪記錄,它有不同國家、不同文化的考量。有的以社會利益為本位的國家不把犯罪記錄作為隱私,他們認為如果把犯罪記錄作為隱私保護起來的話,會對周圍人的安全帶來隱患,雖然公開犯罪記錄也可能會使被公開者的尊嚴受損。
難以操作的個人信息保護指令
我們現(xiàn)在說的個人信息、敏感信息的概念來自歐盟。歐盟與中國國情不同,拿過來沒有可操作性。今天在討論隱私遇到互聯(lián)網(wǎng)時,一定要知道這個隱私是什么樣的隱私,否則討論就沒有任何意義。歐美的隱私觀,表面上看好像尊重了個人權利,好像很現(xiàn)代化,實際上不僅沒有任何積極意義,還會帶來很多消極的作用?,F(xiàn)在所說的“隱私遇上互聯(lián)網(wǎng)”的這個隱私,不是我講的法律上的隱私,而是受到歐美隱私觀影響的一種東西。
在個人信息中,姓名、家庭地址、電話號碼都是在社會交往中正常產(chǎn)生的,我們反對的是騷擾電話、垃圾短信這樣的濫用行為?,F(xiàn)在買賣個人信息很常見,發(fā)送垃圾短信、騷擾電話,有人認為是侵犯隱私,這看起來非常誘人的想法實際上正是導致問題泛濫的根源。按照刑法修正案,情節(jié)嚴重的買賣個人信息是一種犯罪行為,但是起訴維權的成本特別高,侵權和犯罪的成本卻特別低?,F(xiàn)在的隱私觀念聽起來講人權,但客觀上不利于受害人維權。
我們現(xiàn)在的立法是學習歐盟的,全國人大常委會2012年通過一個規(guī)定,互聯(lián)網(wǎng)公司在收集個人信息的時候應當征得當事人的同意,當事人有決定權是否讓你收集;有知情權,你基于什么樣的目的收集個人信息,收集以后存在什么地方;當事人也有查看的權利、刪除的權利、修改的權利,比如信息記錄不完整、有出入時可以進行修改;甚至還有被遺忘的權利———以前互聯(lián)網(wǎng)上的信息,時過境遷不希望放在網(wǎng)上的時候有權請求刪除,刪除之后在互聯(lián)網(wǎng)上就被遺忘了,所以是被遺忘的權利。
收集信息所涉及的同意、知情、查詢、修改、刪除權是歐盟1995年的個人信息保護指令中所規(guī)定的內容,去年修改時增加了被遺忘的權利,但是這個權利的落實需要技術上的一個先決條件,就是當事人必須知道自己的信息何時何地被何人收集在了什么地方,這樣才能行使相關權利。歐盟的個人信息保護指令源于上世紀60年代末70年代初,那時只有銀行、保險、電信公司和政府機構才有大型計算機,但現(xiàn)在,移動互聯(lián)網(wǎng)的出現(xiàn)讓信息的收集無時無處不在,每個人的工作單位、電話號碼、家庭地址能說清楚何時何地被何人收集了嗎?所以現(xiàn)在的立法和認識都遠遠過時了,沒有辦法操作。
去年歐洲討論很激烈的是被遺忘的權利,最后勉強通過,我們馬上將歐洲的東西引進過來。歐洲有沒有大的互聯(lián)網(wǎng)公司?一個都沒有。歐盟像垂暮的老年,特別保守,極端推崇個人的權利、個人的自由,歐盟的隱私觀就是極端個人主義自由觀的體現(xiàn)。
互聯(lián)網(wǎng)收集的信息多數(shù)不是隱私
當隱私遇到互聯(lián)網(wǎng),很多時候我們說的那個隱私其實并不是隱私?;ヂ?lián)網(wǎng)收集信息無處不在無時不有,但收集的這些信息多數(shù)不屬于隱私范疇:比如說在當當購書了,就會發(fā)現(xiàn)上網(wǎng)時會提示你買什么書;或者使用了搜索引擎,下次再使用時就會自動彈出相關的東西,很多人都錯誤地認為這是侵犯了隱私。排除政府的行為,對互聯(lián)網(wǎng)企業(yè)來說,你要是認為它收集的信息侵犯了你的隱私,這十有八九是自作多情?;ヂ?lián)網(wǎng)企業(yè)無需知道你是張三還是李四,它只需要有針對性地推廣商品和服務。
在互聯(lián)網(wǎng)背景下,要區(qū)分什么是我的個人信息,什么是可以找到我的信息。個人信息是由若干片斷組合而成的,N個片斷的組合才是我的個人信息。如果N -1個片斷的話,不是完整的我,就不是個人信息了。所以行為偏好不是個人信息,個人信息是能夠直接或間接識別出一個人的信息總和,單單行為偏好的數(shù)據(jù)不足以識別出一個完整的我。但是行為偏好數(shù)據(jù)可以讓商家很快找到這個人所需要的服務,對雙方都有好處。所以隱私遇到互聯(lián)網(wǎng),有一個觀念要轉變,很多人認為商家收集信息就是侵犯個人隱私,這是錯誤的,是對互聯(lián)網(wǎng)的誤解。一般來說互聯(lián)網(wǎng)公司無需知道一個人的個人信息,也沒有動機知道,知道對它沒有任何好處,只有壞處。只有一種情況例外,就是比如公安機關依法定程序找互聯(lián)網(wǎng)企業(yè)要信息。
現(xiàn)在的大數(shù)據(jù)時代還意味著,原來散落在互聯(lián)網(wǎng)各個角落的信息,通過數(shù)據(jù)信息的收集、加工技術,海量數(shù)據(jù)將連在一起。這樣,原來不能識別出一個人的N -1、N - 2、N -3個信息就可以還原為N個信息,就可以找到這個人,實行實名化。所以這里有一個原則,在大數(shù)據(jù)的背景下對數(shù)據(jù)的加工分析匹配過程一定要匿名化。匿名化對商家來說,就是處理的這些數(shù)據(jù)不會知道具體是誰的信息,只是數(shù)據(jù)而已。收集加工處理越精準,才越有利于用戶和企業(yè)之間減少交易成本。當然還有一個原則,陰私是禁止收集、禁止加工的,但遵循匿名原則的話,這個問題就不存在了。
只要我們遵循以上的這些原則,隱私遇到互聯(lián)網(wǎng)其實沒有什么大問題,不像傳說中那么恐怖。最重要的,一是要規(guī)范政府的行為,二是要規(guī)范企業(yè)的信息加工,使最后的匹配行為一定匿名化。如果這兩點做到了,在互聯(lián)網(wǎng)環(huán)境下,我們就不要老強調信息安全,害怕泄露隱私。現(xiàn)在我們在觀念上本末倒置,強調信息的安全,事實上無法安全。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓練與驗證損失驟升:機器學習訓練中的異常診斷與解決方案 在機器學習模型訓練過程中,“損失曲線” 是反映模型學習狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計基本概念成為業(yè)務決策的底層邏輯 統(tǒng)計基本概念是商業(yè)數(shù)據(jù)分析的 “基礎語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11