
大數(shù)據(jù)時(shí)代 你還有隱私嗎_數(shù)據(jù)分析師
“我點(diǎn)擊了自己的名字,頁(yè)面上出現(xiàn)了一張熟悉的照片——是我穿著一件藍(lán)色襯衫的照片,旁邊配有我的基本履歷資料……我點(diǎn)開(kāi)了一個(gè)最近更新的鏈接,地點(diǎn)是波士頓的馬薩諸塞大街……兩秒鐘后,我在視頻中看到了自己推開(kāi)了地鐵站那厚重的大門(mén)……每次看到自己出現(xiàn)在視頻中,我都會(huì)渾身不自在。但現(xiàn)在可好,我的一舉一動(dòng)已經(jīng)被LifeLinear網(wǎng)的系統(tǒng)給記錄了下來(lái)……”
以上是出自美國(guó)作家艾伯特-拉斯洛·巴拉巴西今年的新書(shū)《爆發(fā)》中的片段,其中出現(xiàn)的能夠每時(shí)每刻記錄人們行蹤的“LifeLinear系統(tǒng)”只是作者杜撰出來(lái),并非真實(shí)存在。但是作者同時(shí)認(rèn)為,在科技發(fā)達(dá)的今天,借助大數(shù)據(jù)的平臺(tái),“LifeLinear系統(tǒng)”并非不能實(shí)現(xiàn)。這樣的場(chǎng)景又讓人毛骨悚然:如果真有這樣一套系統(tǒng)面世,我們的隱私豈不是要暴露在光天化日之下?大數(shù)據(jù)堪稱(chēng)一把雙刃劍。不論是企業(yè)還是個(gè)人,都會(huì)因大數(shù)據(jù)的爆發(fā)獲益匪淺,但同時(shí)個(gè)人隱私也無(wú)處遁形。隨之而來(lái)的問(wèn)題是:這些數(shù)據(jù)應(yīng)當(dāng)屬于誰(shuí)?誰(shuí)有權(quán)利利用這些數(shù)據(jù)進(jìn)行分析?這種利用能否有個(gè)限度?
大數(shù)據(jù)改變世界
大數(shù)據(jù)概念相對(duì)“年輕”,但是對(duì)于很多人并不陌生。數(shù)據(jù)的爆發(fā)歸功于社交網(wǎng)絡(luò)、電子商務(wù)和物聯(lián)網(wǎng)的快速發(fā)展。以前,人們只是將上網(wǎng)當(dāng)做娛樂(lè)方式之一,現(xiàn)在,人們更多的是生活在網(wǎng)絡(luò)平臺(tái)上。這使得每18個(gè)月,數(shù)據(jù)量就會(huì)翻一番。海量數(shù)據(jù)的影響力是不可小覷的。麻省理工學(xué)院斯隆管理學(xué)院的經(jīng)濟(jì)學(xué)教授埃里克·布呂諾爾夫松(Erik Brynjolfsson)曾經(jīng)指出,在商業(yè)、經(jīng)濟(jì)及其他領(lǐng)域中,決策行為將日益基于數(shù)據(jù)和分析而作出,而并非基于經(jīng)驗(yàn)和直覺(jué)。“我們的決策能夠開(kāi)始變得更加科學(xué)化?!彼@樣說(shuō)。
越來(lái)越多的企業(yè)希望借助數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析等為自身帶來(lái)更多利益。最典型的一個(gè)案例就是,華爾街有炒家利用電腦程序分析當(dāng)時(shí)全球3.4億微博賬戶(hù)的留言來(lái)判斷民眾情緒,再以1到50為其打分,根據(jù)分?jǐn)?shù)高低處理手中的股票。判斷原則很簡(jiǎn)單:如果多數(shù)人表現(xiàn)興奮,那就買(mǎi)入;如果大家的焦慮情緒上升,那就拋售。這一數(shù)據(jù)分析軟件幫助該炒家在今年第一季度獲得了7%的收益率。
當(dāng)然,消費(fèi)者也會(huì)享受到更方便和更具個(gè)性化的服務(wù)。網(wǎng)購(gòu)狂人李雪(化名)每天早上打開(kāi)郵件,首先映入眼簾的就是各大電子商務(wù)網(wǎng)站發(fā)出的訂閱郵件和個(gè)性化推薦的郵件,著實(shí)方便了她在網(wǎng)上進(jìn)行目標(biāo)性極強(qiáng)的有選擇的“掃蕩式”購(gòu)物。這是商家根據(jù)對(duì)用戶(hù)的頁(yè)面停留時(shí)間、瀏覽與購(gòu)買(mǎi)商品的分類(lèi)等數(shù)據(jù)的分析作出的推薦。
另外,還可以通過(guò)數(shù)據(jù)分析來(lái)為人們的提供健康保障??偛课挥诿绹?guó)加州的醫(yī)療管理財(cái)團(tuán)Kaiser Permanente,收集并分析所有的臨床分析和成本數(shù)據(jù),發(fā)現(xiàn)了美國(guó)默沙東公司的神經(jīng)和肌肉、骨骼系統(tǒng)藥“萬(wàn)絡(luò)”能夠引發(fā)心臟病的副作用,最終成功使其退出市場(chǎng)。《爆發(fā)》一書(shū)中提出,如果大數(shù)據(jù)被充分利用,在流行病的控制等方面也會(huì)發(fā)揮奇效。
誰(shuí)來(lái)掌控屬于你的大數(shù)據(jù)
每個(gè)人都期待獲得個(gè)性化服務(wù)。但是,在大數(shù)據(jù)時(shí)代,想要獲得個(gè)性化服務(wù),就一定會(huì)在某種程度上犧牲自己的隱私。
當(dāng)你在使用電子郵件、社交網(wǎng)絡(luò)的時(shí)候,你大概也會(huì)知道你的信息正在被記錄下來(lái),你發(fā)表的言論或者分享的照片、視頻等都決定著互聯(lián)網(wǎng)運(yùn)營(yíng)商即將向你推薦什么樣的資源和廣告;當(dāng)你拿著iPhone滿(mǎn)世界跑的時(shí)候,蘋(píng)果早已通過(guò)定位系統(tǒng)把你的全部信息收羅在自己的數(shù)據(jù)庫(kù)里,利用這些信息來(lái)構(gòu)建地圖和交通信息等;當(dāng)你在享受著視頻監(jiān)控帶來(lái)的安全感的同時(shí),別忘了你也是被監(jiān)控的一分子,你的一舉一動(dòng)都會(huì)暴露在鏡頭下面;你用手機(jī)通話(huà)時(shí),運(yùn)營(yíng)商不僅知道你打給誰(shuí),打了多久,還知道你是在哪里進(jìn)行的通話(huà)。
以前,這些記錄幾乎不會(huì)對(duì)普通人造成影響,因?yàn)樗臄?shù)量如此巨大,除非刻意尋找,人們不會(huì)注意其中的某些信息。但是,隨著大數(shù)據(jù)技術(shù)的不斷進(jìn)步,這一狀況正在發(fā)生改變。本文之前提到的懸而未決的問(wèn)題隨之而來(lái),造成了很多尷尬的局面。例如,Facebook公司內(nèi)部的科學(xué)家已經(jīng)利用這些數(shù)據(jù)進(jìn)行了大量研究并發(fā)表了超過(guò)30篇論文,但Facebook顧慮到隱私問(wèn)題,并未公布原始數(shù)據(jù),使得這些論文無(wú)法被業(yè)界承認(rèn)并應(yīng)用在廣泛的社會(huì)學(xué)和心理學(xué)領(lǐng)域。同時(shí),外界的研究者苦于沒(méi)有數(shù)據(jù),進(jìn)行相關(guān)研究時(shí)遠(yuǎn)遠(yuǎn)沒(méi)有Facebook得心應(yīng)手。今年8月,F(xiàn)acebook公司表示正計(jì)劃向社會(huì)學(xué)家開(kāi)放有限的數(shù)據(jù)訪(fǎng)問(wèn)權(quán)限,這又會(huì)帶來(lái)更多爭(zhēng)議。此外,谷歌也和美國(guó)政府就數(shù)據(jù)利用問(wèn)題產(chǎn)生了多次沖突。美國(guó)政府以各種理由不斷要求谷歌提供用戶(hù)數(shù)據(jù)并時(shí)常遭到谷歌拒絕。同時(shí),美國(guó)政府也對(duì)街景等應(yīng)用進(jìn)行調(diào)查,限制谷歌收集更多數(shù)據(jù)以制衡谷歌。
微軟研究院的高級(jí)研究員博伊德(Danah Boyd)曾經(jīng)表示:“如今,我們社交網(wǎng)絡(luò)化的社會(huì)絕對(duì)有制造恐慌的天分。在大數(shù)據(jù)時(shí)代,對(duì)隱私泄露的擔(dān)憂(yōu)就是強(qiáng)大的緊張和焦慮的源泉。人們普遍認(rèn)為,最令人焦慮的在于你根本不知道什么時(shí)候自己的隱私就無(wú)意中被泄露出去。”她認(rèn)為,這并不是我們希望建立的社會(huì)。
人們最擔(dān)心的,是對(duì)這種數(shù)據(jù)的無(wú)限制利用?!侗l(fā)》一書(shū)中更指出,人的行為看似隨機(jī)無(wú)序,但實(shí)際上是存在某種規(guī)律的。社交網(wǎng)絡(luò)如此發(fā)達(dá)的今天,大數(shù)據(jù)把人的行為進(jìn)行放大分析,從而能夠相對(duì)準(zhǔn)確地預(yù)測(cè)人的性格和行程。所以,不排除有這樣一種可能:在忙完了一天的工作之后,你還沒(méi)有決定要去哪兒,數(shù)據(jù)中心卻早就先于你準(zhǔn)確預(yù)測(cè)了接下來(lái)的目的地。
人們是否存在真正的隱私
當(dāng)前,數(shù)據(jù)的數(shù)量時(shí)刻都在飛速增長(zhǎng)。信息分享在全世界范圍內(nèi)越廣泛,確保數(shù)據(jù)安全和保護(hù)人們隱私的任務(wù)就越難完成?,F(xiàn)如今,人與人之間交流產(chǎn)生的流量遠(yuǎn)遠(yuǎn)大于文件傳輸產(chǎn)生的流量,但是,人與人之間的交流可以界定為隱私,屬于比較敏感的范疇。由此看來(lái),整個(gè)互聯(lián)網(wǎng)都是隱私的,是不可公開(kāi)的。但是,現(xiàn)有的互聯(lián)網(wǎng)結(jié)構(gòu)下,你的所有應(yīng)用對(duì)于服務(wù)提供商,其實(shí)都是透明的。那么,人們既想要借助互聯(lián)網(wǎng)的平臺(tái)與別人交流,又想要自己的空間不被窺探,這是完全不可能的。
《爆發(fā)》一書(shū)中指出,為獲得便利,人們未來(lái)會(huì)接受匿名的隱私泄露。但是,在過(guò)去的幾年中,計(jì)算機(jī)專(zhuān)家一再表示,即使是匿名的數(shù)據(jù)也可以被重新確定,并且歸屬到具體的個(gè)人。例如,如果一筆超市購(gòu)物記錄中的零食全都和你的愛(ài)好相符、提供記錄的超市正好位于你公司到家里的路上、購(gòu)物時(shí)間剛好是你下班和到家之間的時(shí)間,這筆購(gòu)物就很有可能與你相關(guān),如果單子里剛好有你之前微博上表示感興趣的商品,那就更有可能了。曾經(jīng),谷歌的一位工程師在解釋“為什么不收集與人的名字相關(guān)的信息”的時(shí)候說(shuō)道:“我們根本就不需要名字,名字對(duì)我們來(lái)說(shuō)完全多余。谷歌記錄網(wǎng)民搜索查詢(xún)、位置和網(wǎng)上行為的大型數(shù)據(jù)庫(kù)中就有大量信息,這足以讓谷歌間接地了解一個(gè)人?!?這意味著人們隱私權(quán)的最后一道防線(xiàn)同樣脆弱得不堪一擊。
人們只能寄希望于在政府加大立法制度的同時(shí),企業(yè)自身也設(shè)定相關(guān)規(guī)則實(shí)現(xiàn)自我管控。在美國(guó)北卡羅來(lái)納州,曾經(jīng)有人因?yàn)楣椭骺戳怂贔acebook上的信息而求職失敗,求職者對(duì)雇主起訴并打贏(yíng)官司。為此,北卡羅來(lái)納州專(zhuān)門(mén)立法規(guī)定雇主不得對(duì)雇員進(jìn)行網(wǎng)上監(jiān)控。Facebook也專(zhuān)門(mén)設(shè)立了首席隱私官。不過(guò),政府和企業(yè)本身就擁有最多的數(shù)據(jù),它們會(huì)真正限制自己對(duì)數(shù)據(jù)的應(yīng)用嗎?這將是未來(lái)大數(shù)據(jù)時(shí)代頭上的一把達(dá)摩克利斯之劍。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶(hù) ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱(chēng) BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢(xún)到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢(xún)結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢(xún)結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專(zhuān)注于從單 ...
2025-07-09year_month數(shù)據(jù)類(lèi)型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類(lèi)型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專(zhuān)業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03