
商院案例:大數(shù)據(jù)安全隱患與體系建設(shè)
著互聯(lián)網(wǎng)、云計(jì)算、物聯(lián)網(wǎng)等網(wǎng)絡(luò)技術(shù)快速發(fā)展和智能終端、智慧城市廣泛應(yīng)用及大范圍建設(shè),全球數(shù)據(jù)量呈現(xiàn)爆炸式增長(zhǎng),驅(qū)動(dòng)著整個(gè)互聯(lián)網(wǎng)世界邁入大數(shù)據(jù)時(shí)代。
為應(yīng)對(duì)大數(shù)據(jù)時(shí)代的挑戰(zhàn),推廣大數(shù)據(jù)基礎(chǔ)分析、技術(shù)研發(fā)與應(yīng)用、安全技術(shù),以及推進(jìn)大數(shù)據(jù)技術(shù)創(chuàng)新管理能力和業(yè)務(wù)能力、加強(qiáng)大數(shù)據(jù)安全與隱私管理,廣東省信息協(xié)會(huì)、廣東省計(jì)算機(jī)信息網(wǎng)絡(luò)安全協(xié)會(huì)、廣東省大數(shù)據(jù)技術(shù)聯(lián)盟聯(lián)合主辦的“2014廣東省大數(shù)據(jù)應(yīng)用與安全高峰論壇”定于10月21日(星期二)上午在廣東亞洲國(guó)際大酒店召開(kāi)且圓滿結(jié)束。
藍(lán)盾股份作為中國(guó)信息安全行業(yè)領(lǐng)先的專業(yè)網(wǎng)絡(luò)安全企業(yè)和服務(wù)提供商,也應(yīng)邀參加該次峰會(huì),并圍繞“大數(shù)據(jù)應(yīng)用安全隱患與安全體系建設(shè)”作出了重要演講。
下文就演講的幾個(gè)重要方面整理成文,重點(diǎn)歸納總結(jié)了大數(shù)據(jù)的應(yīng)用價(jià)值、大數(shù)據(jù)背景下面臨的安全問(wèn)題以及對(duì)大數(shù)據(jù)時(shí)代安全建設(shè)的幾點(diǎn)考慮。
一、大數(shù)據(jù)背景介紹
1、大數(shù)據(jù)特性
大數(shù)據(jù)(Big Data)是指“無(wú)法用現(xiàn)有的軟件工具提取、存儲(chǔ)、搜索、共享、分析和處理的海量的、復(fù)雜的數(shù)據(jù)集合?!睒I(yè)界通常用4個(gè)V(即Volume、Variety、Value、Velocity)來(lái)概括大數(shù)據(jù)的基本特征。
一是數(shù)據(jù)體量巨大(Volume)。據(jù)國(guó)際知名數(shù)據(jù)公司IDC 提供的更為復(fù)雜的新數(shù)據(jù)已經(jīng)出現(xiàn),而且生成的速度達(dá)到了前所未有的程度,IBM預(yù)計(jì),到2020年將增至40萬(wàn)億GB的水平。
二是數(shù)據(jù)類型繁多(Variety)。大數(shù)據(jù)來(lái)源種類豐富,更為復(fù)雜的新數(shù)據(jù)已經(jīng)出現(xiàn),社交網(wǎng)絡(luò)數(shù)據(jù)、網(wǎng)絡(luò)日志、存檔數(shù)據(jù)和傳感器數(shù)據(jù)、地理位置信息都屬于人們?cè)诜治鲋嘘P(guān)注的新數(shù)據(jù)源。
三是價(jià)值密度低(Value)。雖然每天產(chǎn)生25億GB數(shù)據(jù),但其中只有接近0.5%的經(jīng)檢測(cè)數(shù)據(jù)才具有分析價(jià)值。
四是處理速度快(Velocity)。面對(duì)如此海量的數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)也越來(lái)越多,如何快速地處理這些數(shù)據(jù)并挖掘出有價(jià)值的信息,這也是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征。
2、大數(shù)據(jù)技術(shù)趨勢(shì)
1)Hadoop技術(shù)的應(yīng)用
Apache
hadoop是一個(gè)開(kāi)源的分布式計(jì)算框架,通過(guò)集成MapReduce技術(shù),Hadoop將大數(shù)據(jù)分布到多個(gè)數(shù)據(jù)節(jié)點(diǎn)上進(jìn)行處理。Hadoop遵循Apache 2.0許可證,可以輕松處理結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),一舉成為現(xiàn)在非常流行的大數(shù)據(jù)解決方案,可以用來(lái)應(yīng)對(duì)PB甚至ZB級(jí)的海量數(shù)據(jù)存儲(chǔ)。
2)與云計(jì)算的融合
大數(shù)據(jù)和云是兩個(gè)不同的概念,但兩者之間有很多交集。支撐大數(shù)據(jù)以及云計(jì)算的底層原則是一樣的,即規(guī)?;?、自動(dòng)化、資源配置、自愈性,因此實(shí)際上大數(shù)據(jù)和云之間存在很多合力的地方。可以說(shuō)大數(shù)據(jù)和云計(jì)算是相伴而生的,大數(shù)據(jù)的處理離不開(kāi)云,大數(shù)據(jù)應(yīng)用是在云上跑的、非常典型的應(yīng)用。
二、大數(shù)據(jù)的應(yīng)用價(jià)值
《華爾街日?qǐng)?bào)》將大數(shù)據(jù)時(shí)代、智能化生產(chǎn)和無(wú)線網(wǎng)絡(luò)革命稱為引領(lǐng)未來(lái)繁榮的三大技術(shù)變革。麥肯錫公司的報(bào)告指出數(shù)據(jù)是一種生產(chǎn)資料,大數(shù)據(jù)是下一個(gè)創(chuàng)新、競(jìng)爭(zhēng)、生產(chǎn)力提高的前沿。更有世界經(jīng)濟(jì)論壇報(bào)告認(rèn)定:大數(shù)據(jù)為新財(cái)富,價(jià)值堪比石油。
就國(guó)內(nèi)外對(duì)大數(shù)據(jù)的研究與投入來(lái)看,2014年,Intel、IBM、微軟、阿里巴巴[微博]等行業(yè)巨頭紛紛布局大數(shù)據(jù)。IDC預(yù)測(cè)2014年產(chǎn)生2萬(wàn)TB數(shù)據(jù),2014年大數(shù)據(jù)產(chǎn)值超6億,2016年將可望突破100億。
那么,這些看似平凡的數(shù)據(jù)能為我們帶來(lái)什么?事實(shí)上當(dāng)你把微博等社交平臺(tái)當(dāng)作發(fā)泄工具時(shí),專業(yè)的斂財(cái)高手們卻正在挖掘這些互聯(lián)網(wǎng)的“數(shù)據(jù)財(cái)富”,先人一步用這些數(shù)據(jù)來(lái)預(yù)判市場(chǎng)走勢(shì),做出正確的決定,并取得不俗的收益。
大數(shù)據(jù)的核心價(jià)值是能夠?yàn)檎?、企業(yè)提供決策服務(wù),幫助企業(yè)把握市場(chǎng)機(jī)遇、迅速實(shí)現(xiàn)大數(shù)據(jù)商業(yè)模式創(chuàng)新,協(xié)助政府建設(shè)智慧城市和應(yīng)對(duì)公共安全,幫助公安進(jìn)行犯罪預(yù)測(cè)與預(yù)防。
例如,華爾街根據(jù)民眾情緒拋售股票;美國(guó)疾控中心依據(jù)國(guó)民搜索,分析全球范圍內(nèi)流感等病疫的傳播狀況;投資機(jī)構(gòu)搜集并分析上市企業(yè)聲明,從中尋找破產(chǎn)的蛛絲馬跡;電信行業(yè)利用大數(shù)據(jù)幫助電信業(yè)對(duì)業(yè)務(wù)的分析和優(yōu)化;電子商務(wù)收集、分析海量的消費(fèi)者數(shù)據(jù),從中挖掘消費(fèi)者多變、復(fù)雜的需求。
總之,在大數(shù)據(jù)時(shí)代,以利用數(shù)據(jù)價(jià)值為核心,合理挖掘和利用大數(shù)據(jù),已經(jīng)為各行各業(yè)帶來(lái)了巨額財(cái)富。
三、大數(shù)據(jù)的安全隱患
隨著大數(shù)據(jù)應(yīng)用的爆發(fā)性增長(zhǎng),大數(shù)據(jù)衍生出獨(dú)特架構(gòu),并推動(dòng)存儲(chǔ)、網(wǎng)絡(luò)及計(jì)算機(jī)技術(shù)的發(fā)展,同時(shí)也引發(fā)了新的安全問(wèn)題。
1、網(wǎng)絡(luò)化社會(huì)使大數(shù)據(jù)成攻擊目標(biāo)
開(kāi)放的網(wǎng)絡(luò)化社會(huì),大數(shù)據(jù)的數(shù)據(jù)量大且相互關(guān)聯(lián),對(duì)于攻擊者而言,相對(duì)低的成本可以獲得“滾雪球”的收益。用戶數(shù)據(jù)泄露,個(gè)人賬號(hào)信息失竊的事件時(shí)有發(fā)生,一旦遭受攻擊,失竊的數(shù)據(jù)量也是巨大的。
最近幾年來(lái)數(shù)以百萬(wàn)計(jì)的信息大泄密和大量的網(wǎng)絡(luò)犯罪案件說(shuō)明,大數(shù)據(jù)和云環(huán)境下的信息安全的風(fēng)險(xiǎn)度已非昔時(shí)可比。
2、大數(shù)據(jù)加大隱私泄露風(fēng)險(xiǎn)
大數(shù)據(jù)是把“雙刃劍”,快捷的網(wǎng)絡(luò)、精準(zhǔn)的營(yíng)銷,雖能帶給人們一個(gè)更加便捷的生活方式,同時(shí),卻也讓個(gè)人隱私的保護(hù)幾成空談。數(shù)據(jù)分析技術(shù)的發(fā)展,勢(shì)必對(duì)用戶隱私產(chǎn)生極大威脅。如今的大數(shù)據(jù)營(yíng)銷,對(duì)于消費(fèi)者而言,就好似被一雙眼睛盯著,每時(shí)每刻窺探著你的一舉一動(dòng),作為個(gè)體消費(fèi)者,我們?cè)缇蜔o(wú)法避免自己的個(gè)人隱私被網(wǎng)絡(luò)系統(tǒng)記取被商家掌握并挖掘利用,甚至被惡意使用。
3、技術(shù)短板帶來(lái)的安全隱患
NOSQL(非關(guān)系型數(shù)據(jù)庫(kù))作為大數(shù)據(jù)處理的基礎(chǔ)技術(shù),與當(dāng)前廣泛應(yīng)用的SQL(關(guān)系型數(shù)據(jù)庫(kù))技術(shù)不同,沒(méi)有經(jīng)過(guò)長(zhǎng)期改進(jìn)和完善,在維護(hù)數(shù)據(jù)安全方面也未設(shè)置嚴(yán)格的訪問(wèn)控制和隱私管理,缺乏保密性和完整性特質(zhì)。
4、大數(shù)據(jù)環(huán)境打破傳統(tǒng)安全壁壘
大數(shù)據(jù)的處理和存儲(chǔ)離不開(kāi)云,其運(yùn)營(yíng)環(huán)境的特殊性打破了傳統(tǒng)的網(wǎng)絡(luò)邊界壁壘,使得傳統(tǒng)的安全技術(shù)手段無(wú)法做到有效的安全防護(hù)。
大數(shù)據(jù)本身的安全防護(hù)存在漏洞,雖然云計(jì)算對(duì)大數(shù)據(jù)提供了便利,但對(duì)大數(shù)據(jù)的安全控制力度仍然不夠。
5、大數(shù)據(jù)可能成為高級(jí)可持續(xù)攻擊的載體
APT攻擊是一個(gè)持續(xù)的過(guò)程,不具有被實(shí)時(shí)檢測(cè)到的明顯特征。同時(shí),隱藏在大量數(shù)據(jù)中的APT攻擊代碼也很難被發(fā)現(xiàn)。此外,攻擊者還可以利用社交網(wǎng)絡(luò)和系統(tǒng)漏洞進(jìn)行攻擊,在威脅特征庫(kù)無(wú)法檢測(cè)出來(lái)的時(shí)間段發(fā)起攻擊行為。
四、大數(shù)據(jù)時(shí)代下的安全體系建設(shè)
1、大數(shù)據(jù)存儲(chǔ)安全
大量的數(shù)據(jù)產(chǎn)生、存儲(chǔ)和分析,數(shù)據(jù)安全存儲(chǔ)問(wèn)題將在未來(lái)幾年內(nèi)成為一個(gè)更大的問(wèn)題。行業(yè)必須盡快盡早規(guī)劃和布局大數(shù)據(jù)安全存儲(chǔ)防護(hù)措施,協(xié)同技術(shù)的發(fā)展,加大安全防護(hù)投入。安全存儲(chǔ)是大數(shù)據(jù)安全的最基本需求,我們可以從集中存儲(chǔ)、加密存儲(chǔ)、加密傳輸、認(rèn)證授權(quán)和日志審計(jì)等方面來(lái)對(duì)大數(shù)據(jù)的安全存儲(chǔ)環(huán)境加大保護(hù)力度。
2、個(gè)人隱私信息的保護(hù)
大數(shù)據(jù)和個(gè)人隱私之間的“戰(zhàn)爭(zhēng)”早已打響,必須從技術(shù)和法規(guī)層面上保障大數(shù)據(jù)時(shí)代的隱私安全,完善用戶個(gè)人信息的保障體系。
法規(guī)層面應(yīng)從標(biāo)準(zhǔn)和法律兩個(gè)方面界定數(shù)據(jù)屬性和銷售許可,出臺(tái)相應(yīng)資質(zhì)認(rèn)證和法律法規(guī),建立健全大數(shù)據(jù)隱私安全保障體系。
技術(shù)層面應(yīng)使用大數(shù)據(jù)清洗、去隱私化等技術(shù)完成對(duì)客戶隱私數(shù)據(jù)的隱藏化處理。
3、大數(shù)據(jù)云安全
大數(shù)據(jù)一般都需要在云中實(shí)現(xiàn)上傳、下載及交互,在吸引越來(lái)越多黑客和病毒攻擊的云端及客戶端做好安全保護(hù)必不可少。
我們可基于虛擬化的云數(shù)據(jù)中心提供系統(tǒng)性的安全解決方案,以安全虛擬器件代替原有硬件設(shè)備的產(chǎn)品交付方式,確保物理、虛擬和云環(huán)境中服務(wù)器的應(yīng)用程序和數(shù)據(jù)的安全,可以為云和虛擬化環(huán)境提供主動(dòng)防御、自動(dòng)安全保護(hù),將傳統(tǒng)數(shù)據(jù)中心的安全策略擴(kuò)展到云計(jì)算平臺(tái)上。
4、建立防御機(jī)制
在規(guī)劃大數(shù)據(jù)發(fā)展的同時(shí),建立并完善大數(shù)據(jù)信息安全體系很有必要。結(jié)合傳統(tǒng)信息安全技術(shù)和考量大數(shù)據(jù)收集、處理和應(yīng)用時(shí)的實(shí)際環(huán)境安全需求,建立面向大數(shù)據(jù)信息安全的事件監(jiān)測(cè)機(jī)制,及時(shí)發(fā)現(xiàn)信息系統(tǒng)安全問(wèn)題,當(dāng)大數(shù)據(jù)運(yùn)營(yíng)環(huán)境遭到攻擊前或已經(jīng)遭到攻擊時(shí),快速、準(zhǔn)確地發(fā)現(xiàn)攻擊行為,并迅速啟動(dòng)處置和應(yīng)急機(jī)制。
5、重新規(guī)范管理員的權(quán)限
大數(shù)據(jù)的跨平臺(tái)傳輸應(yīng)用在一定程度上會(huì)帶來(lái)內(nèi)在風(fēng)險(xiǎn),可以根據(jù)大數(shù)據(jù)的密級(jí)程度和用戶需求的不同,將大數(shù)據(jù)和用戶設(shè)定不同的權(quán)限等級(jí),并嚴(yán)格控制訪問(wèn)權(quán)限。而且,通過(guò)單點(diǎn)登錄的統(tǒng)一身份認(rèn)證與權(quán)限控制技術(shù),對(duì)用戶訪問(wèn)進(jìn)行嚴(yán)格的控制,有效地保證大數(shù)據(jù)應(yīng)用安全。
總之,大數(shù)據(jù)時(shí)代機(jī)遇與挑戰(zhàn)并存,在推進(jìn)大數(shù)據(jù)技術(shù)創(chuàng)新管理能力和業(yè)務(wù)能力的同時(shí),要加強(qiáng)大數(shù)據(jù)安全與隱私管理相關(guān)研究的力度,通過(guò)政策法規(guī)與技術(shù)手段相互作用,使大數(shù)據(jù)在我國(guó)各個(gè)行業(yè)得以沿著正確的方向更快、更深入的發(fā)展。
特別說(shuō)明:由于各方面情況的不斷調(diào)整與變化,新浪網(wǎng)所提供的所有考試信息僅供參考,敬請(qǐng)考生以權(quán)威部門公布的正式信息為準(zhǔn)。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10