
大數(shù)據(jù)時(shí)代更加注重個(gè)人隱私_數(shù)據(jù)分析師
近日,谷歌因侵犯數(shù)據(jù)隱私在法國(guó)被罰,理由是未整改其跟蹤并儲(chǔ)存用戶信息的違法行為。此事要回溯到2012年3月,谷歌啟用新的數(shù)據(jù)收集方案,修改了隱私政策,通過(guò)YouTube、Gmail等服務(wù)收集數(shù)據(jù)并整合在一起。雖然谷歌稱此舉可以為用戶提供更加便捷、高效的服務(wù),但法國(guó)國(guó)家信息自由委員會(huì)(CNIL)認(rèn)為谷歌對(duì)用戶信息的處理不夠透明,用戶既不知道這些數(shù)據(jù)會(huì)被怎樣處理,也不知道谷歌處理其個(gè)人數(shù)據(jù)信息的目的,而且用戶別無(wú)選擇。
最終,谷歌被CNIL處罰15萬(wàn)歐元,雖然跟谷歌的收入相比簡(jiǎn)直微不足道,但此判罰將引發(fā)世界各地對(duì)個(gè)人隱私保護(hù)的連鎖反應(yīng)。據(jù)悉,谷歌新的隱私政策在西班牙、英國(guó)、德國(guó)、意大利以及荷蘭都遭到了相似的指控。
上述案例是目前吵得沸沸揚(yáng)揚(yáng)的大數(shù)據(jù)與個(gè)人隱私之爭(zhēng)的典型代表。未來(lái)隨著大數(shù)據(jù)應(yīng)用的進(jìn)一步廣泛,個(gè)人隱私保護(hù)將面臨更為嚴(yán)峻的挑戰(zhàn)。
福爾摩斯可以從微小的細(xì)節(jié)中發(fā)現(xiàn)案件的相關(guān)蛛絲馬跡,勾勒出嫌疑人的形象。同樣,大數(shù)據(jù)通過(guò)對(duì)海量數(shù)據(jù)的分析,也可以將一個(gè)人具象化。
互聯(lián)網(wǎng)的個(gè)人隱私問(wèn)題由來(lái)已久
自己的秘密不愿讓他人知道,是自己的權(quán)利,這個(gè)權(quán)利就叫隱私權(quán)。在互聯(lián)網(wǎng)時(shí)代,個(gè)人隱私問(wèn)題主要是指對(duì)個(gè)人隱私權(quán)的侵犯。比如個(gè)人照片,當(dāng)事人主動(dòng)在網(wǎng)上分享與當(dāng)事人不情愿卻被他人放到網(wǎng)上分享是截然不同的兩種情形,后者顯然侵犯了個(gè)人隱私。人們的個(gè)人身份信息,以及人們?cè)诨ヂ?lián)網(wǎng)上的各種行為,在沒(méi)有任何提示的情況下被網(wǎng)站存儲(chǔ)、利用,甚至泄露,這就是目前互聯(lián)網(wǎng)在個(gè)人隱私方面涉及的主要問(wèn)題。
互聯(lián)網(wǎng)上個(gè)人隱私問(wèn)題由來(lái)已久,因?yàn)閭€(gè)人隱私信息具有很高的利用價(jià)值。去年的央視315讓人們了解到Cookie這一古老的收集個(gè)人上網(wǎng)行為的工具,在人們接觸互聯(lián)網(wǎng)的過(guò)程中,網(wǎng)民的性別、年齡、職業(yè)、興趣等等都會(huì)成為有價(jià)值的數(shù)據(jù),互聯(lián)網(wǎng)廣告可以通過(guò)這些數(shù)據(jù)實(shí)現(xiàn)精準(zhǔn)的推送。在社交網(wǎng)絡(luò)興起之后,網(wǎng)民之間的社交關(guān)系同樣極具價(jià)值:當(dāng)你的某個(gè)朋友將要過(guò)生日時(shí),生日禮物的廣告已經(jīng)鋪天蓋地提前占滿所有屏幕。同樣,LBS興起之后,網(wǎng)民的地理位置信息同樣可被利用,人們到達(dá)任意位置,附件商家的信息可以即時(shí)呈現(xiàn)。即使不用LBS,移動(dòng)通信基站同樣可以實(shí)現(xiàn)定位
大數(shù)據(jù)讓互聯(lián)網(wǎng)隱私問(wèn)題更加突出
既然個(gè)人隱私問(wèn)題是互聯(lián)網(wǎng)Web2.0生來(lái)攜帶的胎毒,那為何還要與大數(shù)據(jù)應(yīng)用起爭(zhēng)執(zhí)呢?我們知道,大數(shù)據(jù)分析是大數(shù)據(jù)應(yīng)用的撒手锏,Gartner將大數(shù)據(jù)描述為具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力。大數(shù)據(jù)可以對(duì)海量的信息進(jìn)行分析并發(fā)現(xiàn)其中的價(jià)值,這種能力讓其成為了互聯(lián)網(wǎng)應(yīng)用中的夏洛克福爾摩斯。大數(shù)據(jù)應(yīng)用中,前面所述的所有類型的個(gè)人信息都可以關(guān)聯(lián)利用,使得這個(gè)人更加具象。所以說(shuō),大數(shù)據(jù)應(yīng)用下互聯(lián)網(wǎng)隱私問(wèn)題顯得更加突出。
不過(guò),大數(shù)據(jù)與個(gè)人隱私之間的關(guān)系并非處處劍拔弩張。在討論這個(gè)問(wèn)題之前,可以先看這么幾則案例:
送到機(jī)場(chǎng)的晚餐
當(dāng)一位顧客開(kāi)玩笑地通過(guò)推特向位于芝加哥的牛排連鎖店Morton牛排店訂餐,并要求送到紐約Newark機(jī)場(chǎng)(他將在一天工作之后抵達(dá)該處)時(shí),Morton開(kāi)始了自己的社交秀。首先,分析推特?cái)?shù)據(jù),發(fā)現(xiàn)該顧客是本店的???,也是推特的常用者。根據(jù)客戶以往的訂單,推測(cè)出其所乘的航班,然后派出一位身著燕尾服的侍者為客戶提供晚餐。
摸清賭客的脾氣
現(xiàn)實(shí)中的賭客個(gè)個(gè)深藏不露,但在互聯(lián)網(wǎng)上就沒(méi)那么神了。Tipp24 AG針對(duì)歐洲博彩業(yè)構(gòu)建的下注和預(yù)測(cè)平臺(tái),利用KXEN軟件來(lái)分析數(shù)十億計(jì)的交易以及客戶的特性,然后通過(guò)預(yù)測(cè)模型對(duì)特定用戶進(jìn)行動(dòng)態(tài)的營(yíng)銷活動(dòng)。這項(xiàng)舉措減少了90%的預(yù)測(cè)模型構(gòu)建時(shí)間。
定制化求婚
這不能算作一個(gè)案例。在百度有一個(gè)奇思妙想實(shí)驗(yàn)室,在足夠規(guī)模的用戶數(shù)據(jù)和技術(shù)積累下,輸入一句簡(jiǎn)單的怎么向女友求婚,通過(guò)跨領(lǐng)域推薦引擎技術(shù),便能找到一套為你量身打造的方案。甚至連道具、路線、天氣,乃至如何討得她家小狗歡心的方法都考慮得一應(yīng)俱全。
大數(shù)據(jù)炒股
經(jīng)典的大數(shù)據(jù)應(yīng)用。華爾街有炒家利用電腦程序分析全球3.4億微博賬戶的留言來(lái)判斷民眾情緒,再以1到50為其打分。同時(shí)根據(jù)打分的結(jié)果,來(lái)處理手中數(shù)以百萬(wàn)美元的股票。判斷原則很簡(jiǎn)單:如果多數(shù)人表現(xiàn)興奮,那就買(mǎi)入;如果大家的焦慮情緒上升,那就拋售。這一數(shù)據(jù)分析幫助該炒手今年第一季度獲得了7%的收益率。
上述的四則案例中,前面三個(gè)均是針對(duì)個(gè)人的定制化服務(wù),在利用大數(shù)據(jù)的過(guò)程中,必然會(huì)涉及大量的個(gè)人隱私信息,其中有哪些是用戶授權(quán)的,哪些是未經(jīng)授權(quán)的,這些分析系統(tǒng)未必能分得清楚,因此帶來(lái)一系列的侵犯隱私的問(wèn)題;對(duì)于第四種行為,對(duì)群體信息進(jìn)行分析,筆者認(rèn)為其實(shí)際上已經(jīng)做到了脫敏,并不涉及隱私問(wèn)題。
相比Cookie、社交、LBS的單一功能,大數(shù)據(jù)綜合利用到更多的隱私信息,當(dāng)然也帶來(lái)更加定制化的服務(wù)。良好的用戶體驗(yàn)恰恰又需要高度定制化的服務(wù),因此如何平衡隱私與定制服務(wù)的關(guān)系成為難題。美國(guó)《連線》雜志創(chuàng)始人凱文凱利曾經(jīng)說(shuō)過(guò)說(shuō):如果需要個(gè)性化服務(wù),就必須用透明度換取。最大化的個(gè)性化意味著最大化的透明化。如果不想透露任何信息,那就不能期待別人把自己當(dāng)作有個(gè)性的個(gè)體。
對(duì)群體信息的分析實(shí)際上已經(jīng)實(shí)現(xiàn)了脫敏
好壞之分:看AK47在誰(shuí)的手里
每個(gè)網(wǎng)民、每個(gè)消費(fèi)者都無(wú)法避免個(gè)人隱私被互聯(lián)網(wǎng)記錄和利用。雖然DNT(Do Not Track,禁止跟蹤)技術(shù)可以阻止記錄瀏覽行為,但通過(guò)對(duì)移動(dòng)終端的定位,結(jié)合網(wǎng)關(guān)的上網(wǎng)行為分析依然能識(shí)別每一個(gè)人。大數(shù)據(jù)的特點(diǎn)已經(jīng)講過(guò)了,可以對(duì)所有的數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,從這個(gè)意義上說(shuō),大數(shù)據(jù)面前人人無(wú)所遁形。
大數(shù)據(jù)只是一個(gè)工具,好與壞要看人們?cè)趺慈ビ盟?。就像卡拉什尼科夫發(fā)明的AK47"
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-18剛?cè)肼殘?chǎng)或是在職場(chǎng)正面臨崗位替代、技能更新、人機(jī)協(xié)作等焦慮的打工人,想要找到一條破解職場(chǎng)焦慮和升職瓶頸的系統(tǒng)化學(xué)習(xí)提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價(jià)值的煉金術(shù) ...
2025-07-18CDA 數(shù)據(jù)分析師:數(shù)據(jù)時(shí)代的價(jià)值挖掘者 在大數(shù)據(jù)席卷全球的今天,數(shù)據(jù)已成為企業(yè)核心競(jìng)爭(zhēng)力的重要組成部分。從海量數(shù)據(jù)中提取有 ...
2025-07-18SPSS 賦值后數(shù)據(jù)不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數(shù)據(jù)分析過(guò)程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實(shí)現(xiàn)表數(shù)據(jù)同步操作指南? ? 在數(shù)據(jù)庫(kù)管理工作中,將一張表的數(shù)據(jù)同步到另一張表是常見(jiàn)需求,這有助于 ...
2025-07-18數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價(jià)值的橋梁? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫(xiě)入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對(duì)這樣的場(chǎng)景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時(shí)代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動(dòng)的數(shù)據(jù)曲線尋找增長(zhǎng)密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)的實(shí)戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項(xiàng)” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實(shí)踐 在 MySQL 數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)中,索引是提升查詢性能的核心手段。無(wú)論 ...
2025-07-16解析 MySQL Update 語(yǔ)句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫(kù)的日常運(yùn)維與開(kāi)發(fā)中,開(kāi)發(fā)者和 DBA 常會(huì) ...
2025-07-16如何考取數(shù)據(jù)分析師證書(shū):以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動(dòng)企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無(wú)外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫(kù)的日常操作中,我們經(jīng)常會(huì)遇到需要整合多張表數(shù)據(jù)的場(chǎng)景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,面對(duì)海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫(kù)操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問(wèn)題時(shí)有發(fā)生。 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開(kāi)啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書(shū)) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11