
大數(shù)據(jù)安全 的六大挑戰(zhàn)_數(shù)據(jù)分析師考試
大數(shù)據(jù)的價值為大家公認(rèn)。業(yè)界通常以4個“V”來概括大數(shù)據(jù)的基本特征——Volume(數(shù)據(jù)體量巨大)、Variety(數(shù)據(jù)類型繁多)、Value(價值密度低)、Velocity(處理速度快)。當(dāng)你準(zhǔn)備對大數(shù)據(jù)所帶來的各種光鮮機(jī)遇大加利用的同時,請別忘記大數(shù)據(jù)也會引入新的安全威脅,存在于大數(shù)據(jù)時代“潘多拉魔盒”中的魔鬼可能會隨時出現(xiàn)。
挑戰(zhàn)一:大數(shù)據(jù)的巨大體量使得信息管理成本顯著增加
4個“V”中的第一個“V”(Volume),描述了大數(shù)據(jù)之大,這些巨大、海量數(shù)據(jù)的管理問題是對每一個大數(shù)據(jù)運(yùn)營者的最大挑戰(zhàn)。在網(wǎng)絡(luò)空間,大數(shù)據(jù)是更容易被“發(fā)現(xiàn)”的顯著目標(biāo),大數(shù)據(jù)成為網(wǎng)絡(luò)攻擊的第一演兵場所。一方面,大量數(shù)據(jù)的集中存儲增加了泄露風(fēng)險,黑客的一次成功攻擊能獲得比以往更多的數(shù)據(jù)量,無形中降低了黑客的進(jìn)攻成本,增加了“攻擊收益”;另一方面,大數(shù)據(jù)意味著海量數(shù)據(jù)的匯集,這里面蘊(yùn)藏著更復(fù)雜、更敏感、價值巨大的數(shù)據(jù),這些數(shù)據(jù)會引來更多的潛在攻擊者。
在大數(shù)據(jù)的消費(fèi)者方面,公司在未來幾年將處理更多的內(nèi)部生成的數(shù)據(jù)。然而在許多組織中,不同的部門像財務(wù)、工程、生產(chǎn)、市場、IT等之間的信息仍然是孤立的,各部門之間相互設(shè)防,造成信息無法共享。那些能夠在不破壞壁壘和部門現(xiàn)實(shí)優(yōu)勢的前提下更透明地溝通的公司將更具競爭優(yōu)勢。
【解決方案】 首先要找到有安全管理經(jīng)驗(yàn)并受過大數(shù)據(jù)管理所需要技能培訓(xùn)的人員,尤其是在今天人力成本和培訓(xùn)成本不斷上升的節(jié)奏中,這一定足以讓許多CEO肝顫,但這些針對大數(shù)據(jù)管理人員的巨額教育和培訓(xùn)成本,是一種非常必要的開銷。
與此同時,在流程的設(shè)計上,一定要將數(shù)據(jù)分散存儲,任何一個存儲單元被“黑客”攻破,都不可能拿到全集,同時對于不同安全域要進(jìn)行準(zhǔn)確的評估,像關(guān)鍵信息索引的保護(hù)一定要加強(qiáng),“好鋼用在刀刃上”,作為數(shù)據(jù)保全,能夠應(yīng)對部分設(shè)施的災(zāi)難性損毀。
挑戰(zhàn)二:大數(shù)據(jù)的繁多類型使得信息有效性驗(yàn)證工作大大增加
4個“V”中的第二個“V”(Variety),描述了數(shù)據(jù)類型之多,大數(shù)據(jù)時代,由于不再拘泥于特定的數(shù)據(jù)收集模式,使得數(shù)據(jù)來自于多維空間,各種非結(jié)構(gòu)化的數(shù)據(jù)與結(jié)構(gòu)化的數(shù)據(jù)混雜在一起。
未來面臨的挑戰(zhàn)將會是從數(shù)據(jù)中提取需要的數(shù)據(jù),很多組織將不得不接受的現(xiàn)實(shí)是,太多無用的信息造成的信息不足或信息不匹配。我們可以考慮這樣的邏輯:依托于大數(shù)據(jù)進(jìn)行算法處理得出預(yù)測,但是如果這些收集上來的數(shù)據(jù)本身有問題又該如何呢?也許大數(shù)據(jù)的數(shù)據(jù)規(guī)??梢允沟梦覀儫o視一些偶然非人為的錯誤,但是如果有個敵手故意放出干擾數(shù)據(jù)呢?現(xiàn)在非常需要研究相關(guān)的算法來確保數(shù)據(jù)來源的有效性,尤其是比較強(qiáng)調(diào)數(shù)據(jù)有效性的大數(shù)據(jù)領(lǐng)域。
正是因?yàn)檫@個原因,對于正在收集和儲存大量客戶數(shù)據(jù)的公司來說,最顯而易見的威脅就是在過去的幾年里,存放于企業(yè)數(shù)據(jù)庫中數(shù)以TB計,不斷增加的客戶數(shù)據(jù)是否真實(shí)可靠,依然有效。
眾所周知,海量數(shù)據(jù)本身就蘊(yùn)藏著價值,但是如何將有用的數(shù)據(jù)與沒有價值的數(shù)據(jù)進(jìn)行區(qū)分看起來是一個棘手的問題,甚至引發(fā)越來越多的安全問題。
【解決方案】 嘗試盡可能使數(shù)據(jù)類型具體化,增加對數(shù)據(jù)更細(xì)粒度的了解,使數(shù)據(jù)本身更加細(xì)化,縮小數(shù)據(jù)的聚焦范圍,定義數(shù)據(jù)的相關(guān)參數(shù),數(shù)據(jù)的篩選要做得更加精致。與此同時,進(jìn)一步健全特征庫,加強(qiáng)數(shù)據(jù)的交叉驗(yàn)證,通過邏輯沖突去偽存真。
挑戰(zhàn)三:大數(shù)據(jù)的低密度價值分布使得安全防御邊界有所擴(kuò)展
4個“V”中的第三個“V”(Value),描述了大數(shù)據(jù)單位數(shù)據(jù)的低價值。這種廣種薄收似的價值量度,使得信息效能被攤薄了,大數(shù)據(jù)的安全預(yù)防與攻擊事件的分析過程更加復(fù)雜,相當(dāng)于安全管理范圍被放大了。
大數(shù)據(jù)時代的安全與傳統(tǒng)信息安全相比,變得更加復(fù)雜,具體體現(xiàn)在三個方面:一方面,大量的數(shù)據(jù)匯集,包括大量的企業(yè)運(yùn)營數(shù)據(jù)、客戶信息、個人的隱私和各種行為的細(xì)節(jié)記錄,這些數(shù)據(jù)的集中存儲增加了數(shù)據(jù)泄露風(fēng)險;另一方面,因?yàn)橐恍┟舾袛?shù)據(jù)的所有權(quán)和使用權(quán)并沒有被明確界定,很多基于大數(shù)據(jù)的分析都未考慮到其中涉及的個體隱私問題;再一方面,大數(shù)據(jù)對數(shù)據(jù)完整性、可用性和秘密性帶來挑戰(zhàn),在防止數(shù)據(jù)丟失、被盜取、被濫用和被破壞上存在一定的技術(shù)難度,傳統(tǒng)的安全工具不再像以前那么有用。
【解決方案】 確立有限管理邊界,依據(jù)保護(hù)要求,加強(qiáng)重點(diǎn)保護(hù),構(gòu)建一體化的數(shù)據(jù)安全管理體系,遵循網(wǎng)絡(luò)防護(hù)和數(shù)據(jù)自主預(yù)防并重的原則,并不是實(shí)施了全面的網(wǎng)絡(luò)安全護(hù)理就能徹底解決大數(shù)據(jù)的安全問題,數(shù)據(jù)不丟失只是傳統(tǒng)的邊界網(wǎng)絡(luò)安全的一個必要補(bǔ)充,我們還需要對大數(shù)據(jù)安全管理的盲區(qū)進(jìn)行監(jiān)控,只有將二者結(jié)合在一起,才是一個全面的一體化安全管理的解決方案
挑戰(zhàn)四:大數(shù)據(jù)的快速處理要求使得獨(dú)立決策的比例顯著降低
“4個“V”中最后一個“V”(Velocity),決定了利用海量數(shù)據(jù)快速得出有用信息的屬性。
大數(shù)據(jù)時代,對事物因果關(guān)系的關(guān)注,轉(zhuǎn)變?yōu)閷κ挛锵嚓P(guān)關(guān)系的關(guān)注。如果大數(shù)據(jù)系統(tǒng)只是一種輔助決策系統(tǒng),這還不是最可怕的。事實(shí)上,今天大數(shù)據(jù)分析日益成為一項(xiàng)重要的業(yè)務(wù)決策流程,越來越多的決策結(jié)果來自于大數(shù)據(jù)的分析建議,對于領(lǐng)導(dǎo)者最艱難的事情之一,是讓我的邏輯思考來做決定,還是由機(jī)器的數(shù)據(jù)分析做決定,可怕的是,今天看來,機(jī)器往往是正確的,這不得不讓我們產(chǎn)生依賴。試想一下,如果收集的數(shù)據(jù)已經(jīng)被修正過,或是系統(tǒng)邏輯已經(jīng)被控制了呢!但是面對海量的數(shù)據(jù)收集、存儲、管理、分析和共享,傳統(tǒng)意義上的對錯分析和奇偶較驗(yàn)已失去作用。
【解決方案】 在依靠大數(shù)據(jù)進(jìn)行分析、決策的同時,還應(yīng)輔助其他的傳統(tǒng)決策支持系統(tǒng),盡可能明智地使用數(shù)據(jù)所告訴我們的結(jié)果,讓大數(shù)據(jù)為我們所用。但絕對不要片面地依賴于大數(shù)據(jù)系統(tǒng)。
挑戰(zhàn)五:大數(shù)據(jù)獨(dú)特的導(dǎo)入方式使得攻防雙方地位的不對等性大大降低
在大數(shù)據(jù)時代,數(shù)據(jù)加工和存儲鏈條上的時空先后順序已被模糊,可擴(kuò)展的數(shù)據(jù)聯(lián)系使得隱私的保護(hù)更加困難。過去傳統(tǒng)的安全防護(hù)工作,是先扎好籬笆、筑好墻,等待“黑客”的攻擊,我們雖然不知道下一個“黑客”是誰,但我們一定知道,它是通過尋求新的漏洞,從前面逐層進(jìn)入。守方在明處,但相比攻方有明顯的壓倒性優(yōu)勢。而在大數(shù)據(jù)時代,任何人都可以是信息的提供者和維護(hù)者,這種由先天的結(jié)構(gòu)性導(dǎo)入設(shè)計所帶來的變化,你很難知道“它”從哪里進(jìn)來,“哪里”才是前沿。這種變化,使得攻、防雙方的力量對比的不對等性大大下降。
同時,由于這種不對等性的降低,在我們用數(shù)據(jù)挖掘和數(shù)據(jù)分析等大數(shù)據(jù)技術(shù)獲取有價值信息的同時,“黑客”也可以利用這些大數(shù)據(jù)技術(shù)發(fā)起新的攻擊。“黑客”會最大限度地收集更多有用信息,比如社交網(wǎng)絡(luò)、郵件、微博、電子商務(wù)、電話和家庭住址等信息,大數(shù)據(jù)分析使“黑客”的攻擊更加精準(zhǔn)。此外,“黑客”可能會同時控制上百萬臺傀儡機(jī),利用大數(shù)據(jù)發(fā)起僵尸網(wǎng)絡(luò)攻擊。
【解決方案】 面對大數(shù)據(jù)所帶來新的安全問題,有針對性地更新安全防護(hù)手段,增加新型防護(hù)手段,混合生產(chǎn)數(shù)據(jù)和經(jīng)營數(shù)據(jù),多種業(yè)務(wù)流并行,增加特征標(biāo)識建設(shè)內(nèi)容,增強(qiáng)對數(shù)據(jù)資源的管理和控制。
挑戰(zhàn)六:大數(shù)據(jù)網(wǎng)絡(luò)的相對開放性使得安全加固策略的復(fù)雜性有所降低
在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)的使用者同時也是數(shù)據(jù)的創(chuàng)造者和供給者,數(shù)據(jù)間的聯(lián)系是可持續(xù)擴(kuò)展的,數(shù)據(jù)集是可以無限延伸的,上述原因就決定了關(guān)于大數(shù)據(jù)的應(yīng)用策略要有新的變化,并要求大數(shù)據(jù)網(wǎng)絡(luò)更加開放。大數(shù)據(jù)要對復(fù)雜多樣的數(shù)據(jù)存儲內(nèi)容做出快速處理,這就要求很多時候,安全管理的敏感度和復(fù)雜度不能定得太高。此外,大數(shù)據(jù)強(qiáng)調(diào)廣泛的參與性,這將倒逼系統(tǒng)管理者調(diào)低許多策略的安全級別。
當(dāng)然,大數(shù)據(jù)的大小也影響到安全控制措施能否正確地執(zhí)行,升級速度無法跟上數(shù)據(jù)量非線性增長的步伐,就會暴露大數(shù)據(jù)安全防護(hù)的漏洞。
【解決方案】 使用更加開放的分布式部署方式,采用更加靈活、更易于擴(kuò)充的信息基礎(chǔ)設(shè)施,基于威脅特征建立實(shí)時匹配檢測,基于統(tǒng)一的時間源消除高級可持續(xù)攻擊(APT)的可能性,精確控制大數(shù)據(jù)設(shè)計規(guī)模,削弱“黑客”可以利用的空間。
大數(shù)據(jù)時代已經(jīng)到來,大數(shù)據(jù)已經(jīng)產(chǎn)生出巨大影響力,并對我們的社會經(jīng)濟(jì)活動帶來深刻影響。充分利用大數(shù)據(jù)技術(shù)來挖掘信息的巨大價值,從而實(shí)現(xiàn)并形成強(qiáng)有力的競爭優(yōu)勢,必將是一種趨勢。面對大數(shù)據(jù)時代的六種安全挑戰(zhàn),如果我們能夠予以足夠重視,采取相應(yīng)措施,將可以起到未雨綢繆的作用。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價值的橋梁? 在數(shù)據(jù)驅(qū)動決策的時代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對這樣的場景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動的數(shù)據(jù)曲線尋找增長密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動業(yè)務(wù)增長的實(shí)戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項(xiàng)” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實(shí)踐 在 MySQL 數(shù)據(jù)庫表結(jié)構(gòu)設(shè)計中,索引是提升查詢性能的核心手段。無論 ...
2025-07-16解析 MySQL Update 語句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫的日常運(yùn)維與開發(fā)中,開發(fā)者和 DBA 常會 ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價值、驅(qū)動決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫的日常操作中,我們經(jīng)常會遇到需要整合多張表數(shù)據(jù)的場景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動的時代,面對海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時用t.test,何時用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10