99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀大數(shù)據(jù)時代的技術(shù)與隱私_數(shù)據(jù)分析師
大數(shù)據(jù)時代的技術(shù)與隱私_數(shù)據(jù)分析師
2015-01-27
收藏

大數(shù)據(jù)時代的技術(shù)與隱私_數(shù)據(jù)分析師


“大數(shù)據(jù)”是當(dāng)今最熱的概念之一,有人把大數(shù)據(jù)形容為未來世界的石油,有人宣稱掌握大數(shù)據(jù)的人可以像上帝一樣俯瞰整個世界,美國政府甚至已經(jīng)把對大數(shù)據(jù)的研究上升為國家戰(zhàn)略。喧嘩的背后,實際上,隨著信息與通訊技術(shù)的發(fā)展,“大數(shù)據(jù)”正進(jìn)入與我們息息相關(guān)的每一個角落。近日,記者參加中國科協(xié)主辦的第36期科學(xué)家與媒體面對面活動,采訪相關(guān)專家,請他們暢談了大數(shù)據(jù)時代的技術(shù)特色與隱私保護(hù)。

大數(shù)據(jù)是什么

故事一:無法完成的任務(wù)

大數(shù)據(jù)是一個時髦的新詞,也是一個古老的現(xiàn)象。因為,對某個時代來說,超出當(dāng)時社會信息處理能力的數(shù)據(jù),就可以說是大數(shù)據(jù)。

以人類遇到的第一個大數(shù)據(jù)人口普查為例。中國在公元2年就有史書記載的人口普查數(shù)據(jù)(《漢書 地理志》):全國103個郡國,人口是59594978人。對當(dāng)時的古代中國來說,近六千萬人口的普查無疑就是一個難以處理的大數(shù)據(jù)。美國憲法曾規(guī)定,美國人口普查十年一次。1880年開始,美國人花8年完成了一次人口普查,并預(yù)計1890年做下一次人口普查大概需要13年時間。也就是說,人口普查成為當(dāng)時一項無法完成的任務(wù)。不過,危機常常帶來新的技術(shù)革命。有人發(fā)明了穿孔卡片制表機,使得這個任務(wù)僅用一年時間就可以完成。穿孔卡片制表機就是今天計算機的前身。

“大數(shù)據(jù)不是今天就出現(xiàn)的,你對付不了的就是大數(shù)據(jù)。”工業(yè)和信息化部電信研究院互聯(lián)網(wǎng)中心主任何寶宏說:“今天所說的大數(shù)據(jù)革命也是2008年之后,這5年來信息發(fā)生了翻天覆地的變化。大數(shù)據(jù)讓物質(zhì)世界變得可計算,這是整個人類的目標(biāo)?!?/span>

無法完成的任務(wù),帶來的是前所未有的技術(shù)突破。如今,移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、基因測序等采集數(shù)據(jù)的工具越來越多樣化,使我們對物質(zhì)世界的描述越來越精確,擁有的數(shù)據(jù)量越來越大;云計算等處理數(shù)據(jù)的工具越來越經(jīng)濟(jì),又使得大數(shù)據(jù)的應(yīng)用走入百姓身邊,對我們的生產(chǎn)和生活方式產(chǎn)生深遠(yuǎn)的影響。

目前大數(shù)據(jù)最成熟的應(yīng)用是互聯(lián)網(wǎng)廣告營銷。近一年中,老百姓在搜索或者瀏覽網(wǎng)頁時會發(fā)現(xiàn),網(wǎng)上推出的廣告越來越精確。這是因為互聯(lián)網(wǎng)廣告已經(jīng)進(jìn)入到完全自動、實時競價的狀態(tài),通過對個人上網(wǎng)行為的分析,推導(dǎo)出這個人的性格特征和可能需要,并有針對性地投放廣告。廣告請求、競價邀請、受眾篩選、申請出價、中標(biāo)投放的全過程,僅需120毫秒也就是0.12秒即可完成,而在傳統(tǒng)媒體完成這樣的工作,很可能需要幾個月的時間。

互聯(lián)網(wǎng)金融也是近一年的大熱點,根基就是由于大數(shù)據(jù)技術(shù)的成熟。互聯(lián)網(wǎng)金融在面對中小企業(yè)的貸款業(yè)務(wù)中,擁有獨特的優(yōu)勢。據(jù)一份對中國互聯(lián)網(wǎng)金融的調(diào)查報告顯示,互聯(lián)網(wǎng)金融對小微企業(yè)貸款時,不良貸款率僅為1.02%,單筆放款成本為2.3元;而傳統(tǒng)銀行對小微企業(yè)的貸款不良率為5.5%至6%,單筆成本達(dá)800元至2000元。這種低成本、低壞賬率、全時服務(wù)(機器可以全天候開啟)的金融服務(wù),使廣大中小企業(yè)變成了互聯(lián)網(wǎng)金融的客戶,可以解決小微企業(yè)貸款難的問題——這其實也是一個過去無法完成的任務(wù)。


[page]

大數(shù)據(jù)怎么用

故事二:不懂外語的翻譯

百度公司發(fā)展研究中心副主任率鵬給記者講了一個有趣的故事?!鞍俣确g”這個工具,目前已經(jīng)提供了24種語言的自動翻譯服務(wù),翻譯質(zhì)量在行業(yè)中領(lǐng)先?!暗@24種語言中有12種語言,整個百度翻譯的團(tuán)隊沒有人能懂。”率鵬說,“大數(shù)據(jù)的技術(shù)使我們完全在不了解、不懂得、不能夠理解這種語言的情況下,僅僅靠技術(shù)本身就開發(fā)出一個非常好的翻譯工具,這在以往的時代是難以想象的。”

不懂外語的外語翻譯,這個聽起來很天方夜譚的故事,其實精準(zhǔn)反映了如今大數(shù)據(jù)技術(shù)的一大特點——不需要知道為什么,只需要知道是什么。

這個技術(shù)特點,是由如今大數(shù)據(jù)本身的特點決定的。中國通信學(xué)會副理事長兼秘書長張新生表示,大數(shù)據(jù)有四大特點:一是海量,大到“以目前的技術(shù)無法管理的數(shù)據(jù)量”;二是多樣,數(shù)據(jù)種類復(fù)雜,非結(jié)構(gòu)數(shù)據(jù)占到所存儲數(shù)據(jù)總量的75%—95%,這些非結(jié)構(gòu)數(shù)據(jù)無法以現(xiàn)在的技術(shù)手段與關(guān)系分析的數(shù)據(jù)庫來處理;三是速度,數(shù)據(jù)產(chǎn)生的頻率和傳送頻率非??欤枰M(jìn)行實時處理;四是價值密度低,需從大量的低質(zhì)量、低價值的數(shù)據(jù)中獲取知識,猶如大海撈針,獲取數(shù)據(jù)成本很高。

事實上,大數(shù)據(jù)還將越來越大。在過去兩年中,全球產(chǎn)生的信息占到人類整體掌握信息總量的90%,現(xiàn)在每天全球產(chǎn)生的數(shù)據(jù)相當(dāng)于國家圖書館館藏總量的1500倍。而互聯(lián)網(wǎng)數(shù)據(jù)中心IDC預(yù)測,到2020年全世界將有300億個物聯(lián)網(wǎng)終端。中國在這一市場上將占據(jù)至關(guān)重要地位,屆時中國普通家庭將擁有40個到50個智能設(shè)備或傳感器,每年創(chuàng)造出20TB的數(shù)據(jù)。而中國國家圖書館藏書是2631萬冊,信息量相當(dāng)于41TB。也就是說,屆時一個普通中國家庭每年產(chǎn)生的數(shù)據(jù),就相當(dāng)于半個國家圖書館。

我們?nèi)绾尾拍懿槐淮髷?shù)據(jù)所淹沒?

“大數(shù)據(jù)的核心重點在于深度挖掘,通過挖掘產(chǎn)生新的應(yīng)用?!睆埿律硎荆髷?shù)據(jù)的處理技術(shù)是一個工具,它有幾個新特色:不再是小樣本、隨機樣本,而要全體數(shù)據(jù);接收數(shù)據(jù)有混雜性,不再追求精確性;關(guān)注事物之間的相關(guān)性,可以只知道是什么,不知道為什么;對所獲數(shù)據(jù)可多次、反復(fù)利用,并可擴(kuò)展,具有互用性,也就是未來可能知道為什么。

大數(shù)據(jù)產(chǎn)業(yè)也在變得越來越大。大數(shù)據(jù)的采集和傳感、物聯(lián)網(wǎng)領(lǐng)域有很大關(guān)聯(lián)性;大數(shù)據(jù)的處理,又和云計算等產(chǎn)業(yè)相關(guān);大數(shù)據(jù)的應(yīng)用和醫(yī)療、金融等各個行業(yè)相關(guān)。未來將有越來越多企業(yè)發(fā)展成大數(shù)據(jù)企業(yè)。

“大數(shù)據(jù)應(yīng)該是我們的戰(zhàn)略性新興產(chǎn)業(yè)中新一代信息技術(shù)重要的產(chǎn)業(yè)部分,和互聯(lián)網(wǎng)產(chǎn)業(yè)、物聯(lián)網(wǎng)產(chǎn)業(yè)、電信產(chǎn)業(yè)都有很大關(guān)聯(lián)性?!敝袊?lián)通網(wǎng)絡(luò)技術(shù)研究院首席專家唐雄燕表示:“大數(shù)據(jù)本身和很多產(chǎn)業(yè)相關(guān),現(xiàn)在可能已經(jīng)有幾千億元的產(chǎn)業(yè)規(guī)模,將來會無處不在。大數(shù)據(jù)的從業(yè)者,未來也將不止是高科技人員,也會有很多藍(lán)領(lǐng)。大數(shù)據(jù)是一個材料,和石油、礦藏一樣,需要有采集數(shù)據(jù)的人員,需要有探礦的人員,各種各樣的人都需要?!?/span>


[page]

大數(shù)據(jù)怎么管

故事三:應(yīng)該保護(hù)的隱私

我國大數(shù)據(jù)應(yīng)用面臨著數(shù)據(jù)資源難以開放共享、數(shù)據(jù)安全和隱私急需保護(hù)、大數(shù)據(jù)技術(shù)創(chuàng)新人才不足等諸多挑戰(zhàn),其中個人隱私如何保護(hù),是大眾最為關(guān)注的問題。

事實上,真正好用的大數(shù)據(jù)技術(shù),應(yīng)該是用加工實現(xiàn)增值,用分析來指導(dǎo)決策,而非販賣用戶個性化隱私這種原始數(shù)據(jù)信息本身的低層次濫用。

中興通訊首席架構(gòu)師、業(yè)務(wù)總工程師羅圣美表示:“使用這些數(shù)據(jù)的企業(yè),其實有兩大類,一類是互聯(lián)網(wǎng)企業(yè),第二類是電信企業(yè)。企業(yè)有安全保護(hù)措施,有技術(shù)解決方案,做只針對群體,而不針對個體的信息挖掘,這是應(yīng)遵循的基本原則?!?/span>

率鵬認(rèn)為,在隱私保護(hù)問題上,大數(shù)據(jù)技術(shù)要重點強調(diào)符號化和用戶特征這兩個概念?!胺柣?,是當(dāng)我們?nèi)プR別一個用戶時,用和他真實信息不相關(guān)的符號標(biāo)記這個用戶。符號通過算法來保證,是單向的識別,使我們能識別出兩次登錄的是同一個用戶,卻無法通過此符號反推出該用戶在真實生活中的姓名、電話和住址,這就基本享受了大數(shù)據(jù)帶來的優(yōu)勢,同時又規(guī)避了信息安全的風(fēng)險。用戶特征,是在大數(shù)據(jù)時代,企業(yè)感興趣的往往是這個用戶的特征,而不是家庭地址、電話號碼真正敏感的信息。比如說,我希望知道你是一個20歲到30歲年齡段,生育過子女,有高等教育學(xué)歷的女性,這些都是你的特征,但是我并不想知道你姓甚名誰,今年多大,有幾個小孩。如果在數(shù)據(jù)使用過程中嚴(yán)格遵循符號化和用戶特征原則,我們就能規(guī)避掉不良風(fēng)險。”

除了技術(shù)以外,政策和立法才是大數(shù)據(jù)時代個人隱私保障的重要憑借。2012年12月28日,《全國人民代表大會常務(wù)委員會關(guān)于加強網(wǎng)絡(luò)信息保護(hù)的決定》審議通過。2013年,工信部根據(jù)全國人大的決定,出臺了關(guān)于互聯(lián)網(wǎng)和電信網(wǎng)個人信息保護(hù)的條例,提出了數(shù)據(jù)保護(hù)的一系列要求。

數(shù)據(jù)需要保護(hù),數(shù)據(jù)也需要交易。大數(shù)據(jù)的保護(hù)與交易需要遵循什么樣的標(biāo)準(zhǔn),是當(dāng)前政策制定者面臨的挑戰(zhàn)。

張新生說:“有價值的數(shù)據(jù)是非常重要的資源,但前提是要建立交易規(guī)則。我國的幾大互聯(lián)網(wǎng)運營企業(yè)都在做大數(shù)據(jù)分析,并且都想把數(shù)據(jù)作為可交易的產(chǎn)品,這需要我們盡快建立數(shù)據(jù)交易有關(guān)的法律法規(guī)。”

何寶宏認(rèn)為,目前的大數(shù)據(jù)分為兩類。一類是公共數(shù)據(jù),比如政府所掌握的數(shù)據(jù),或者公益企業(yè)的數(shù)據(jù),公共數(shù)據(jù)面臨的是開放和共享的問題。一類是商業(yè)數(shù)據(jù),商業(yè)性數(shù)據(jù)需交易,因為這是資產(chǎn),交易產(chǎn)生新的價值?!皹?biāo)準(zhǔn)和政策的制定是不斷摸索的過程,需要隨著市場去探索,我們已經(jīng)深度地介入到關(guān)于目前國內(nèi)數(shù)據(jù)交易的活動中,去探討這方面的政策、標(biāo)準(zhǔn)制定?!?/span>

對于用戶來說,提高信息安全意識、注意個人隱私保護(hù)也十分重要。不過,鑒于大數(shù)據(jù)時代個人隱私保護(hù)的困難程度,已有專家提出了“遺忘”的必要性。牛津大學(xué)教授、大數(shù)據(jù)領(lǐng)域權(quán)威專家維克托就在他的著作《刪除》中表示,對于人類而言,遺忘一直是常態(tài),而記憶才是例外。然而,由于數(shù)字技術(shù)與全球網(wǎng)絡(luò)的發(fā)展,這種平衡已經(jīng)被打破了。大量數(shù)字化的私人信息不僅可能在今天被濫用,在幾年甚至幾十年后仍然可能被濫用。

羅圣美說:“在大數(shù)據(jù)時代,建議國家相關(guān)部門在制定產(chǎn)業(yè)政策時,需要重點考慮涉及個人隱私的信息,采取刪除、鎖定,或者安全加密等多種級別的保密措施,避免個人隱私被檢索、發(fā)現(xiàn)、濫用和擴(kuò)散。

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }