
大數(shù)據(jù)時代喜憂參半,數(shù)據(jù)發(fā)展正面臨轉(zhuǎn)折點(diǎn)
近年來,大數(shù)據(jù)已經(jīng)覆蓋了許多領(lǐng)域,包括互聯(lián)網(wǎng)領(lǐng)域。許多應(yīng)用和平臺熱衷于搜集用戶的信息。而在近日舉行的SXSW(South by Southwest,西南偏南)大會上,專家們卻表達(dá)了對于數(shù)據(jù)會歧視用戶的擔(dān)憂。
會上,獨(dú)立隱私安全專家Ashkan Soldani提及了IBM的一款能夠計(jì)算“恐怖主義得分”的軟件。這款軟件的目的是通過用戶數(shù)據(jù),計(jì)算從敘利亞來到歐洲的人們參與恐怖活動的概率。
大數(shù)據(jù)(bigdata)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。但是,在大數(shù)據(jù)發(fā)揮重要作用的同時,也產(chǎn)生了一系列問題,給人們造成了困擾。
一、許多軟件因數(shù)據(jù)歧視用戶,造成諸多問題
目前,許多企業(yè)都會通過軟件或應(yīng)用搜集用戶信息。在大數(shù)據(jù)時代,這種做法是無可厚非甚至是必要的,但是,用戶數(shù)據(jù)可能會使用戶遭到歧視,甚至造成濫用。
比如,電腦投放求職廣告時,就會產(chǎn)生歧視行為。去年,卡耐基梅隆大學(xué)的研究人員通過一款名叫AdFisher的工具,對其第三方網(wǎng)站上的廣告定向投放過程進(jìn)行了追蹤。結(jié)果表明,當(dāng)谷歌判定求職者為男性時,為其推送高新主管職位消息的概率遠(yuǎn)大于同等條件的女性求職者。
記者Julia Angwin說:“你可能并不知道你為什么沒有得到那份工作,你或許永遠(yuǎn)不會知道,其實(shí)是因?yàn)閿?shù)據(jù)歧視了你”。
對此,AdFisher的開發(fā)者表示:“我認(rèn)為,我們的發(fā)現(xiàn)揭露了目前廣告生態(tài)中開始浮現(xiàn)的諸多歧視和不透明現(xiàn)象。從社會的角度來看,它很值得擔(dān)憂”。
不僅是在工作方面,就連社交軟件都會因?yàn)閿?shù)據(jù)歧視用戶。美國約會應(yīng)用Tinder的付費(fèi)版Tinder Plus推出后,其定價的差異化引發(fā)了爭議。在美國的用戶,18歲到29歲只需9.99美元,但是超過30歲的用戶則需支付19.99美元。而處在英國地區(qū)的用戶,18歲至27歲只需支付3.99英鎊,而超過28歲就必須支付14.99英鎊。
由于這樣的定價,關(guān)于Tinder歧視“大齡未婚青年”的言論一時蔓延開來。對此,Tinder副總裁的解釋是,年輕用戶是高頻使用者,但缺乏金錢,定價較低是為了刺激其購買欲。而大齡用戶對價格或許敏感度更低,所以愿意購買服務(wù)。因此,定價差異化是基于公司測算,并非年齡歧視。
不管這些應(yīng)用是出于怎樣的目的,都或多或少地帶有歧視色彩,并且大數(shù)據(jù)有泄露用戶隱私之嫌。一份研究大數(shù)據(jù)影響的白宮報(bào)告中寫道:“我們長期堅(jiān)持的公民權(quán)利保護(hù)政策對居民信息如何在住房、信用卡、雇傭、健康、教育和交易市場等方面使用有嚴(yán)格的限制,而數(shù)據(jù)分析技術(shù)有可能會擊潰這一防線”。
研究者指出,對于企業(yè)追蹤用戶的過程以及投放廣告的算法有一定的了解,對人權(quán)組織及監(jiān)管機(jī)構(gòu)來說,是相當(dāng)重要的。當(dāng)然,企業(yè)也應(yīng)該采取一些相關(guān)的措施,消除數(shù)據(jù)對用戶帶來的歧視。
大數(shù)據(jù)是在互聯(lián)網(wǎng)時代不可避免的發(fā)展趨勢,但同時,它產(chǎn)生的問題也讓人們有些恐慌。
二、大數(shù)據(jù)發(fā)展正面臨轉(zhuǎn)折點(diǎn),需努力趨利避害
大數(shù)據(jù)的意義就在于,從龐雜的數(shù)據(jù)背后挖掘并分析用戶的行為習(xí)慣與喜好,從而找出更符合用戶“口味”的產(chǎn)品和服務(wù),并結(jié)合用戶需求有針對性地調(diào)整和優(yōu)化自身。
這種作用對于當(dāng)今企業(yè)來說,是極其重要的,其商業(yè)價值大致體現(xiàn)在四個方面。
大數(shù)據(jù)可以實(shí)現(xiàn)客戶群體細(xì)分,并為每個群體量身定制特別的服務(wù);大數(shù)據(jù)可以對現(xiàn)實(shí)環(huán)境進(jìn)行模擬,發(fā)掘出新的需求并使投資回報(bào)率有所提升;大數(shù)據(jù)可以加強(qiáng)部門之間的聯(lián)系,提高生產(chǎn)鏈條與管理鏈條的效率;大數(shù)據(jù)可以使服務(wù)成本降低,找出隱藏線索,對產(chǎn)品和服務(wù)進(jìn)行創(chuàng)新。
對于社會來說,大數(shù)據(jù)的發(fā)展也是有諸多好處的。大數(shù)據(jù)定理表明,在試驗(yàn)不變的條件下,重復(fù)試驗(yàn)過程多次。在大量重復(fù)中,會呈現(xiàn)出幾乎必然的統(tǒng)計(jì)特性。
隨著計(jì)算機(jī)處理能力的增強(qiáng),獲得的數(shù)據(jù)量越大,挖掘出的價值就越多。如果銀行能夠及時發(fā)現(xiàn)風(fēng)險(xiǎn),社會經(jīng)濟(jì)將越發(fā)強(qiáng)大;如果醫(yī)院能夠及時發(fā)現(xiàn)疾病,我們的身體會更加健康;如果通信公司能夠降低成本,我們的話費(fèi)將更加實(shí)惠……
以上情況,都可以通過大數(shù)據(jù)的不斷積累和不斷分析實(shí)現(xiàn)。通過這一過程,我們可以發(fā)現(xiàn)規(guī)律,從而實(shí)現(xiàn)更好的未來。
但是,任何事物都有兩面性,大數(shù)據(jù)時代所產(chǎn)生的問題也同樣不少。
第一,數(shù)據(jù)不夠安全。無論是企業(yè)還是個人,在實(shí)踐過程中都會或多或少地產(chǎn)生數(shù)據(jù)。這些數(shù)據(jù)在當(dāng)今時代并不安全,會有很多方法使它們泄露。
第二,數(shù)據(jù)泄露產(chǎn)生不平等。對于用戶來講,數(shù)據(jù)是一筆財(cái)富,但是遭到了別人的竊取,而自己并未得到任何收益,這對于用戶來說是不公平的。
第三,用戶隱私問題。當(dāng)用戶在網(wǎng)上注冊信息后,這些信息很有可能已經(jīng)被擴(kuò)散,當(dāng)用戶收到一些莫名其妙的郵件、電話、短信時,其實(shí)用戶的各種信息早已被非法的商業(yè)機(jī)構(gòu)賤賣了。
無意中拍的照片,可能會使人一夜成名。用戶的想法、行為、都可能被商家記錄在案。人們擔(dān)心身份被盜用,擔(dān)心數(shù)據(jù)造假,害怕數(shù)據(jù)框定,反感數(shù)據(jù)的不公平造成的歧視。
要解決這些問題,需要克服許多困難,面臨巨大的挑戰(zhàn)。雖然企業(yè)可以更加細(xì)致地去檢驗(yàn)他們的系統(tǒng)和流程,但是依然不能完全解決問題。通常數(shù)據(jù)驅(qū)動的決策都比較隱蔽,即使產(chǎn)生威脅,也不會被輕易發(fā)現(xiàn)。
任何的領(lǐng)域都需要統(tǒng)一,但是大數(shù)據(jù)行業(yè)尚不能立法,因?yàn)榇髷?shù)據(jù)趨勢變化多端,無法掌握立法所面臨的全部背景。
業(yè)內(nèi)專家認(rèn)為,有必要在計(jì)算機(jī)課程中增加數(shù)據(jù)倫理教育,并且更改有歧視傾向的計(jì)算機(jī)程序。盡管不能完全解決問題,但也能起到一定的作用。
馬云說:“很多人還沒搞清楚什么是PC互聯(lián)網(wǎng),移動互聯(lián)網(wǎng)來了,我們還沒搞清楚移動互聯(lián)的時候,大數(shù)據(jù)時代又來了”。不管是喜是憂,大數(shù)據(jù)時代已經(jīng)降臨。
哈佛大學(xué)社會學(xué)教授加里?金說:“這是一場革命,龐大的數(shù)據(jù)資源使得各個領(lǐng)域開始了量化進(jìn)程,無論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進(jìn)程”?,F(xiàn)在的大數(shù)據(jù)領(lǐng)域正面臨一個轉(zhuǎn)折點(diǎn),努力的方向決定著其屬性的發(fā)展。我們應(yīng)該盡量消減其負(fù)面影響,讓大數(shù)據(jù)發(fā)揮其正面作用,從而更好地為人類服務(wù)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03