
大數(shù)據(jù)與隱私安全
我們對于日常生活中的各種“推薦”早已是習(xí)以為常。比如每天打開電子郵箱時,難免會收到各種商品推薦的郵件。我過去在網(wǎng)上買書比較多,郵件中當(dāng)然是以某購書網(wǎng)發(fā)來的新書推薦居多。再比如每次登錄YouTube,總會在網(wǎng)站的主頁看到系統(tǒng)推薦給我的一系列視頻片段。不論推薦的是圖書還是視頻,大概都能和我最近喜歡看的內(nèi)容合拍。但是,每一次享受這種方便的同時,我也會感到一種隱約的不安:在這些推薦的背后,是誰在做出決定呢?
用一個流行的詞匯來概括,替我做出決定的應(yīng)該并不是某個人或一群人,而是所謂的“大數(shù)據(jù)”(BigData)概念。每一次的上網(wǎng)購物,哪怕是對網(wǎng)上內(nèi)容的瀏覽,都在不知不覺中形成了一種屬于我獨有的數(shù)據(jù)。這些數(shù)據(jù)記錄著我的行為習(xí)慣、個人愛好以及種種涉及隱私的訊息,如今卻都被互聯(lián)網(wǎng)公司巨細(xì)無遺地捕捉、收集進入他們的云端數(shù)據(jù)庫,作為向我推送商品的參考依據(jù)。說實話,這些精準(zhǔn)的推薦收到得越多,我心里的不安感反而越有所增加。原因在于,我發(fā)現(xiàn)這些推薦的準(zhǔn)確度越來越高,這意味著我個人的數(shù)據(jù)泄露越多,仿佛內(nèi)心已經(jīng)逐漸被“大數(shù)據(jù)”看穿,連我想些什么都有被精準(zhǔn)預(yù)測的可能。
看似無所不能的大數(shù)據(jù)引起了不少人的警覺,例如國際網(wǎng)絡(luò)安全專家施奈爾(BruceSchneier)。他在《隱形帝國》一書里寫道:“臉書(facebook)只是根據(jù)按贊的動作,就可以推測一個人的種族、個性、政治意識形態(tài)、感情狀態(tài)和藥物使用情形……行銷人員不斷地在尋找一些能代表某人即將花大錢的模式?!毙枰貏e指出的是,這些能夠讓顧客更愿意掏錢買東西的行為數(shù)據(jù),其實也不是什么新東西,過去早已有之,只不過,其用途卻并不在于商業(yè)。
早在二戰(zhàn)期間,數(shù)據(jù)分析便是同盟國勝利的關(guān)鍵因素之一。同盟國數(shù)據(jù)分析活動著名的案例,就包括破譯Enigma密碼避免德軍潛艇攻擊、使用噴火式戰(zhàn)斗機拍攝的2D軍事照片重構(gòu)3D圖像等等。而二戰(zhàn)結(jié)束后,原本是軍用的數(shù)據(jù)采集和分析方法開始被大規(guī)模使用在平民百姓身上。在麥卡錫時代,美國政府曾經(jīng)利用政黨登記、雜志訂閱,以及朋友、鄰居、家人和同事的證詞來收集一個人的資料。施奈爾認(rèn)為,和今天的差別在于,現(xiàn)在的監(jiān)控能力比以前更強,個人數(shù)據(jù)收集更精確完整,而科技已經(jīng)進化到了可以利用電腦做復(fù)雜分析的程度。也就是說,復(fù)雜數(shù)據(jù)分析可直接給出一個準(zhǔn)確度很高的結(jié)論:關(guān)于一個人的信用度、收入、習(xí)慣、生活狀況等等。這些分析對商業(yè)機構(gòu)來說當(dāng)然是極有價值的。
大數(shù)據(jù)的完備和海量反過來恰好說明了我們這個社會對人的監(jiān)控和操縱已經(jīng)到了何其深的程度。以至于我們在做每一個行動之前最好都三思而行,以免給自己帶來麻煩,反為“大數(shù)據(jù)”所傷。事實上,有不少外國的數(shù)據(jù)公司已經(jīng)開始用數(shù)據(jù)軟件分析人們在臉書(facebook)等社交網(wǎng)絡(luò)媒體的行為習(xí)慣,來判斷此人的信用評價、判斷此人的信用風(fēng)險,個人行為成為網(wǎng)上征信的重要手段。而中國國內(nèi)亦開始有公司在對用戶在本土社交網(wǎng)站點贊等等的行為進行分類統(tǒng)計,用以預(yù)測用戶偏好。因此,即使是發(fā)一個朋友圈狀態(tài)以及在別人的朋友圈里點贊時,也要意識到這些行為其實也會被記錄到個人的數(shù)據(jù)庫里。但人們往往會忽略這一顯而易見的事實。
在我們注冊使用的各種社交網(wǎng)站、郵箱、門戶、商業(yè)網(wǎng)站等等的時候,我們其實都過于輕易地同意把自己個人行為的記錄和數(shù)據(jù)提供給了商業(yè)機構(gòu)。這些商業(yè)機構(gòu)在“合法”獲取了個人數(shù)據(jù)之后,又會將數(shù)據(jù)賣給其他的商業(yè)網(wǎng)站或者政府機構(gòu)。據(jù)新聞報道,美國的一個汽車網(wǎng)站在獲得用戶行車的詳細(xì)記錄之后開始動起了數(shù)據(jù)的腦筋,他們決定將數(shù)據(jù)賣給政府交通部門,因為數(shù)據(jù)詳細(xì)記錄了用戶在不同時段和路段的車速和車況,對之進行分析,顯然有利于交通部門更準(zhǔn)確地預(yù)測車主在哪些地段容易超速,方便交通警察開罰單。
隨著“大數(shù)據(jù)”的迅速發(fā)展,類似的個人信息數(shù)據(jù)被越來越多的監(jiān)控、統(tǒng)計、分析,并且被商業(yè)機構(gòu)和政府買賣分享。了解到一個人開車的車速詳細(xì)數(shù)據(jù)已經(jīng)并不奇怪,在現(xiàn)實中,更有海量的個人隱私數(shù)據(jù)在被暗中監(jiān)控統(tǒng)計,而這些涉及個人方方面面隱私的數(shù)據(jù)都沒有得到人們事實上的允許,因此也是不合法并且不合理的。這也就是我為什么一直對于“大數(shù)據(jù)”這個看似時髦的詞匯始終持保留意見的原因。
誰來監(jiān)控監(jiān)控者?這是一個沒有人能回答的問題?,F(xiàn)在,人人似乎都是“大數(shù)據(jù)”的受益者,而其帶來的問題卻尚未充分展現(xiàn)出來。但我們一定不能忘記大數(shù)據(jù)的觀測、產(chǎn)生、統(tǒng)計、使用,事實上都對于個人的自由和隱私構(gòu)成了一種侵害。施奈爾向我們描繪了一個頗為可怕的未來場景:“對我們有些了解的人,能對我們有某種程度的控制。知道我們所有事情的人,能對我們進行完全的控制。監(jiān)控有助于控制?!憋@然,商業(yè)機構(gòu)和權(quán)力部門要想實現(xiàn)這種“數(shù)據(jù)控制”,前提就是要通過各類機構(gòu)來監(jiān)測、收集人們海量的日常數(shù)據(jù)。如此看來,大數(shù)據(jù)的背后,意味著未來人類自由和隱私權(quán)新的威脅,我們當(dāng)引起足夠的警覺并以切實的行動防患于未然。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03