
大數(shù)據(jù)時代 你還有隱私嗎_數(shù)據(jù)分析師考試
“我點(diǎn)擊了自己的名字,頁面上出現(xiàn)了一張熟悉的照片――是我穿著一件藍(lán)色襯衫的照片,旁邊配有我的基本履歷資料……我點(diǎn)開了一個最近更新的鏈接,地點(diǎn)是波士頓的馬薩諸塞大街……兩秒鐘后,我在視頻中看到了自己推開了地鐵站那厚重的大門……每次看到自己出現(xiàn)在視頻中,我都會渾身不自在。但現(xiàn)在可好,我的一舉一動已經(jīng)被LifeLinear網(wǎng)的系統(tǒng)給記錄了下來……”
以上是出自美國作家艾伯特-拉斯洛?巴拉巴西今年的新書《爆發(fā)》中的片段,其中出現(xiàn)的能夠每時每刻記錄人們行蹤的“LifeLinear系統(tǒng)”只是作者杜撰出來,并非真實(shí)存在。但是作者同時認(rèn)為,在科技發(fā)達(dá)的今天,借助大數(shù)據(jù)的平臺,“LifeLinear系統(tǒng)”并非不能實(shí)現(xiàn)。這樣的場景又讓人毛骨悚然:如果真有這樣一套系統(tǒng)面世,我們的隱私豈不是要暴露在光天化日之下?大數(shù)據(jù)堪稱一把雙刃劍。不論是企業(yè)還是個人,都會因大數(shù)據(jù)的爆發(fā)獲益匪淺,但同時個人隱私也無處遁形。隨之而來的問題是:這些數(shù)據(jù)應(yīng)當(dāng)屬于誰?誰有權(quán)利利用這些數(shù)據(jù)進(jìn)行分析?這種利用能否有個限度?
大數(shù)據(jù)改變世界
大數(shù)據(jù)概念相對“年輕”,但是對于很多人并不陌生。數(shù)據(jù)的爆發(fā)歸功于社交網(wǎng)絡(luò)、電子商務(wù)和物聯(lián)網(wǎng)的快速發(fā)展。
以前,人們只是將上網(wǎng)當(dāng)做娛樂方式之一,現(xiàn)在,人們更多的是生活在網(wǎng)絡(luò)平臺上。這使得每18個月,數(shù)據(jù)量就會翻一番。海量數(shù)據(jù)的影響力是不可小覷的。麻省理工學(xué)院斯隆管理學(xué)院的經(jīng)濟(jì)學(xué)教授埃里克?布呂諾爾夫松(Erik Brynjolfsson)曾經(jīng)指出,在商業(yè)、經(jīng)濟(jì)及其他領(lǐng)域中,決策行為將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗(yàn)和直覺?!拔覀兊臎Q策能夠開始變得更加科學(xué)化?!彼@樣說。 越來越多的企業(yè)希望借助數(shù)據(jù)存儲、數(shù)據(jù)分析等為自身帶來更多利益。最典型的一個案例就是,華爾街有炒家利用電腦程序分析當(dāng)時全球3.4億微博賬戶的留言來判斷民眾情緒,再以1到50為其打分,根據(jù)分?jǐn)?shù)高低處理手中的股票。判斷原則很簡單:如果多數(shù)人表現(xiàn)興奮,那就買入;如果大家的焦慮情緒上升,那就拋售。這一數(shù)據(jù)分析軟件幫助該炒家在今年第一季度獲得了7%的收益率。
當(dāng)然,消費(fèi)者也會享受到更方便和更具個性化的服務(wù)。網(wǎng)購狂人李雪(化名)每天早上打開郵件,首先映入眼簾的就是各大電子商務(wù)網(wǎng)站發(fā)出的訂閱郵件和個性化推薦的郵件,著實(shí)方便了她在網(wǎng)上進(jìn)行目標(biāo)性極強(qiáng)的有選擇的“掃蕩式”購物。這是商家根據(jù)對用戶的頁面停留時間、瀏覽與購買商品的分類等數(shù)據(jù)的分析作出的推薦。 另外,還可以通過數(shù)據(jù)分析來為人們的提供健康保障。總部位于美國加州的醫(yī)療管理財(cái)團(tuán)Kaiser Permanente,收集并分析所有的臨床分析和成本數(shù)據(jù),發(fā)現(xiàn)了美國默沙東公司的神經(jīng)和肌肉、骨骼系統(tǒng)藥“萬絡(luò)”能夠引發(fā)心臟病的副作用,最終成功使其退出市場?!侗l(fā)》一書中提出,如果大數(shù)據(jù)被充分利用,在流行病的控制等方面也會發(fā)揮奇效。
誰來掌控屬于你的大數(shù)據(jù)
每個人都期待獲得個性化服務(wù)。但是,在大數(shù)據(jù)時代,想要獲得個性化服務(wù),就一定會在某種程度上犧牲自己的隱私。 當(dāng)你在使用電子郵件、社交網(wǎng)絡(luò)的時候,你大概也會知道你的信息正在被記錄下來,你發(fā)表的言論或者分享的照片、視頻等都決定著互聯(lián)網(wǎng)運(yùn)營商即將向你推薦什么樣的資源和廣告;當(dāng)你拿著iPhone滿世界跑的時候,蘋果早已通過定位系統(tǒng)把你的全部信息收羅在自己的數(shù)據(jù)庫里,利用這些信息來構(gòu)建地圖和交通信息等;當(dāng)你在享受著視頻監(jiān)控帶來的安全感的同時,別忘了你也是被監(jiān)控的一分子,你的一舉一動都會暴露在鏡頭下面;你用手機(jī)通話時,運(yùn)營商不僅知道你打給誰,打了多久,還知道你是在哪里進(jìn)行的通話。 以前,這些記錄幾乎不會對普通人造成影響,因?yàn)樗臄?shù)量如此巨大,除非刻意尋找,人們不會注意其中的某些信息。
但是,隨著大數(shù)據(jù)技術(shù)的不斷進(jìn)步,這一狀況正在發(fā)生改變。本文之前提到的懸而未決的問題隨之而來,造成了很多尷尬的局面。例如,F(xiàn)acebook公司內(nèi)部的科學(xué)家已經(jīng)利用這些數(shù)據(jù)進(jìn)行了大量研究并發(fā)表了超過30篇論文,但Facebook顧慮到隱私問題,并未公布原始數(shù)據(jù),使得這些論文無法被業(yè)界承認(rèn)并應(yīng)用在廣泛的社會學(xué)和心理學(xué)領(lǐng)域。同時,外界的研究者苦于沒有數(shù)據(jù),進(jìn)行相關(guān)研究時遠(yuǎn)遠(yuǎn)沒有Facebook得心應(yīng)手。今年8月,F(xiàn)acebook公司表示正計(jì)劃向社會學(xué)家開放有限的數(shù)據(jù)訪問權(quán)限,這又會帶來更多爭議。此外,谷歌也和美國政府就數(shù)據(jù)利用問題產(chǎn)生了多次沖突。美國政府以各種理由不斷要求谷歌提供用戶數(shù)據(jù)并時常遭到谷歌拒絕。
同時,美國政府也對街景等應(yīng)用進(jìn)行調(diào)查,限制谷歌收集更多數(shù)據(jù)以制衡谷歌。 微軟研究院的高級研究員博伊德(Danah Boyd)曾經(jīng)表示:“如今,我們社交網(wǎng)絡(luò)化的社會絕對有制造恐慌的天分。在大數(shù)據(jù)時代,對隱私泄露的擔(dān)憂就是強(qiáng)大的緊張和焦慮的源泉。人們普遍認(rèn)為,最令人焦慮的在于你根本不知道什么時候自己的隱私就無意中被泄露出去?!彼J(rèn)為,這并不是我們希望建立的社會。 人們最擔(dān)心的,是對這種數(shù)據(jù)的無限制利用?!侗l(fā)》一書中更指出,人的行為看似隨機(jī)無序,但實(shí)際上是存在某種規(guī)律的。社交網(wǎng)絡(luò)如此發(fā)達(dá)的今天,大數(shù)據(jù)把人的行為進(jìn)行放大分析,從而能夠相對準(zhǔn)確地預(yù)測人的性格和行程。
所以,不排除有這樣一種可能:在忙完了一天的工作之后,你還沒有決定要去哪兒,數(shù)據(jù)中心卻早就先于你準(zhǔn)確預(yù)測了接下來的目的地。 人們是否存在真正的隱私 當(dāng)前,數(shù)據(jù)的數(shù)量時刻都在飛速增長。信息分享在全世界范圍內(nèi)越廣泛,確保數(shù)據(jù)安全和保護(hù)人們隱私的任務(wù)就越難完成?,F(xiàn)如今,人與人之間交流產(chǎn)生的流量遠(yuǎn)遠(yuǎn)大于文件傳輸產(chǎn)生的流量,但是,人與人之間的交流可以界定為隱私,屬于比較敏感的范疇。
由此看來,整個互聯(lián)網(wǎng)都是隱私的,是不可公開的。但是,現(xiàn)有的互聯(lián)網(wǎng)結(jié)構(gòu)下,你的所有應(yīng)用對于服務(wù)提供商,其實(shí)都是透明的。那么,人們既想要借助互聯(lián)網(wǎng)的平臺與別人交流,又想要自己的空間不被窺探,這是完全不可能的。 《爆發(fā)》一書中指出,為獲得便利,人們未來會接受匿名的隱私泄露。
但是,在過去的幾年中,計(jì)算機(jī)專家一再表示,即使是匿名的數(shù)據(jù)也可以被重新確定,并且歸屬到具體的個人。例如,如果一筆超市購物記錄中的零食全都和你的愛好相符、提供記錄的超市正好位于你公司到家里的路上、購物時間剛好是你下班和到家之間的時間,這筆購物就很有可能與你相關(guān),如果單子里剛好有你之前微博上表示感興趣的商品,那就更有可能了。曾經(jīng),谷歌的一位工程師在解釋“為什么不收集與人的名字相關(guān)的信息”的時候說道:“我們根本就不需要名字,名字對我們來說完全多余。谷歌記錄網(wǎng)民搜索查詢、位置和網(wǎng)上行為的大型數(shù)據(jù)庫中就有大量信息,這足以讓谷歌間接地了解一個人?!?/span>
這意味著人們隱私權(quán)的最后一道防線同樣脆弱得不堪一擊。 人們只能寄希望于在政府加大立法制度的同時,企業(yè)自身也設(shè)定相關(guān)規(guī)則實(shí)現(xiàn)自我管控。在美國北卡羅來納州,曾經(jīng)有人因?yàn)楣椭骺戳怂贔acebook上的信息而求職失敗,求職者對雇主起訴并打贏官司。
為此,北卡羅來納州專門立法規(guī)定雇主不得對雇員進(jìn)行網(wǎng)上監(jiān)控。Facebook也專門設(shè)立了首席隱私官。不過,政府和企業(yè)本身就擁有最多的數(shù)據(jù),它們會真正限制自己對數(shù)據(jù)的應(yīng)用嗎?這將是未來大數(shù)據(jù)時代頭上的一把達(dá)摩克利斯之劍。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03