
大數(shù)據(jù)的數(shù)據(jù)安全問(wèn)題
過(guò)去幾十年里,大多數(shù)IT部門(mén)大都經(jīng)歷著類(lèi)似的發(fā)展歷程:最初使用的都是一個(gè)高度集中的整裝計(jì)算機(jī)系統(tǒng)(比如,大型主機(jī)),但隨后就像宇宙大爆炸一樣,計(jì)算機(jī)資源爆炸式的四散開(kāi)去,被前所未見(jiàn)的分散和去集中化了。在市場(chǎng)如此活躍的情況下,這種分散是很有意義的。計(jì)算機(jī)平臺(tái)升級(jí)很快,單個(gè)的大型主機(jī)需要有高昂的維護(hù)費(fèi)用來(lái)作支持,這還不如追加投資給低耗能的設(shè)備了,所以說(shuō)大型主機(jī)是在不斷貶值的,其效率也就相應(yīng)降低了(比如,以每年每美元可實(shí)現(xiàn)的MIPS為標(biāo)準(zhǔn)進(jìn)行考量)。
因此,計(jì)算機(jī)處理逐步去集中化是很自然的過(guò)程。事實(shí)上,近些年發(fā)明的很多技術(shù)都在推動(dòng)這個(gè)趨勢(shì)的發(fā)展。
因?yàn)榉稚⒊潭仍絹?lái)越高,從邏輯上講,存儲(chǔ)接下來(lái)也將(總體而言)變得越來(lái)越分散。而事實(shí)上,存儲(chǔ)要在集中和分散之間進(jìn)行權(quán)衡。存儲(chǔ)所扮演的角色比較特殊,數(shù)據(jù)被存儲(chǔ)時(shí)需要足夠的集中,這樣便于管理;但同時(shí)卻又需要足夠的分散,以方便客戶(hù)的有效利用。這就是目前所面臨的問(wèn)題。但這一局面正在發(fā)生改變——這種改變將從安全的角度影響我們管理IT的總體模式,那就是“大數(shù)據(jù)”。
什么是“大數(shù)據(jù)”
新興的“大數(shù)據(jù)”—是虛擬技術(shù)、云計(jì)算和數(shù)據(jù)中心三者使用率增加后的邏輯衍生物。這幾項(xiàng)技術(shù)均有著高成本與高效率的特點(diǎn)。并且它們都能在計(jì)算資源的標(biāo)準(zhǔn)化、整合和集中化上發(fā)揮杠桿作用,從而實(shí)現(xiàn)規(guī)模經(jīng)濟(jì),也幫助成本效益的實(shí)現(xiàn)。但當(dāng)企業(yè)采用了諸如集中存儲(chǔ)之類(lèi)的技術(shù)之后,隨即就發(fā)現(xiàn)這產(chǎn)生了大量的數(shù)據(jù),在某些情況下,甚至達(dá)到了EB級(jí)別。EB到底是怎樣的一個(gè)級(jí)別呢?自有史記載以來(lái),人類(lèi)所產(chǎn)生的信息量總計(jì)約為5EB。
有識(shí)之士(比如社交網(wǎng)絡(luò)里面的一些善于觀察的工程師和科學(xué)家)已經(jīng)發(fā)現(xiàn):如果大量數(shù)據(jù)集中在一地,那么將有機(jī)會(huì)利用這些數(shù)據(jù)來(lái)達(dá)到提高收益的目的。這似乎是大數(shù)據(jù)能帶來(lái)的意外收獲。所以,隨著數(shù)據(jù)量滾雪球般增加的同時(shí),也浮現(xiàn)了利用這些數(shù)據(jù)增值的機(jī)會(huì)。這對(duì)企業(yè)來(lái)說(shuō)具有革命性的意義,它讓我們更多地了解自己的客戶(hù),了解他們?nèi)绾蜗碛梦覀兊姆?wù),以及我們的業(yè)務(wù)總體運(yùn)行情況。
當(dāng)然,對(duì)于我們這些注重安全性的人而言,毫無(wú)疑問(wèn),它已經(jīng)改變了整個(gè)格局。從安全的角度考慮,這種轉(zhuǎn)變的影響有正面的也有負(fù)面的。比如,一方面,將所有的數(shù)據(jù)都存儲(chǔ)在同一個(gè)地方,這使得保護(hù)數(shù)據(jù)會(huì)變得更加簡(jiǎn)單;而另一方面,也方便了黑客,他們的目標(biāo)變得更有誘惑力。如果想從安全的角度來(lái)探究大數(shù)據(jù)所有利弊可能會(huì)花費(fèi)大量的時(shí)間,但是隨著這種轉(zhuǎn)變的深入,數(shù)據(jù)安全的準(zhǔn)則將發(fā)生改變。
為什么呢?因?yàn)閿?shù)據(jù)量是非線性增長(zhǎng)的。絕大多數(shù)企業(yè)都沒(méi)有專(zhuān)門(mén)的工具或流程來(lái)應(yīng)對(duì)這種非線性增長(zhǎng)。也就是說(shuō),隨著數(shù)據(jù)量的不斷增長(zhǎng),我們看到,傳統(tǒng)工具尤其是安全工具正在淡出舞臺(tái)(其實(shí)早已經(jīng)開(kāi)始了),因?yàn)樗鼈円呀?jīng)不再像以前那么有用了。
所以,對(duì)于想搶在這種改變出現(xiàn)之前就預(yù)先制定計(jì)劃(換個(gè)說(shuō)法就是,“避免一開(kāi)始就被牽著鼻子走”)的企業(yè)而言,他們必須考慮清楚,怎樣才能避免被動(dòng)地應(yīng)對(duì)這種改變。如果你考慮使用天然氣的話,你肯定不會(huì)先儲(chǔ)備一堆煤球,不是嗎?所以,重視這個(gè)行業(yè)的走向是很有必要的。
使用的工具和應(yīng)對(duì)流程非常重要
可能有些人會(huì)馬上質(zhì)疑:這有什么要緊?或“我才不在乎數(shù)據(jù)量大小,安全工具怎么可能會(huì)受到影響?”靜下心來(lái)想一想,你的系統(tǒng)正在用什么工具確保其安全?然后再深入地想一下,這些工具中,有多少可支持對(duì)有限數(shù)據(jù)的搜索或轉(zhuǎn)換?
請(qǐng)進(jìn)一步考慮一下,要在一個(gè)大型的網(wǎng)絡(luò)附加存儲(chǔ)或SAN中掃描一個(gè)惡意軟件是多么困難的事情。如果這數(shù)據(jù)庫(kù)增大1千倍,又會(huì)花費(fèi)多少時(shí)間? 10萬(wàn)倍呢?如果以幾何速度增長(zhǎng)呢? 到時(shí)還能像現(xiàn)在這樣每天都能全掃描一次嗎?
如果在對(duì)數(shù)據(jù)進(jìn)行挖掘時(shí)需要進(jìn)行數(shù)據(jù)泄漏防護(hù)(DLP)或法規(guī)遵從又會(huì)怎樣呢?比如說(shuō)PCI 審計(jì)員需要對(duì)存儲(chǔ)在持卡人信息庫(kù)中的數(shù)據(jù)進(jìn)行信用卡號(hào)搜索時(shí),(CDE數(shù)據(jù)量達(dá)到EB級(jí)別的情況不在此例)會(huì)出現(xiàn)什么情況?搜索本身就難度夠大了,更別說(shuō)對(duì)掃描后GB級(jí)別誤報(bào)的手動(dòng)確認(rèn)了。這兩種操作已經(jīng)變得不太現(xiàn)實(shí),如果我們還沿用以前的方法的話。
很多技術(shù)方案中,數(shù)據(jù)的大小會(huì)影響到安全控制或配套操作能否正確運(yùn)行。想象一下,例如,為了確保存儲(chǔ)數(shù)據(jù)和基于文件的數(shù)據(jù)完整性和可控性,需要對(duì)它們進(jìn)行日志分析、文件監(jiān)督和加密/解密操作。這些都屬于數(shù)據(jù)的處理功能。想讓這些操作繼續(xù)可行,對(duì)它們進(jìn)行升級(jí)是很有必要的。所以,為了在大數(shù)據(jù)世界里讓掃描一如既往地容易,一些有識(shí)之士已經(jīng)開(kāi)始設(shè)計(jì)新工具了(例如,數(shù)據(jù)庫(kù)),所以,我們使用的安全工具也必須革新,這樣才能應(yīng)對(duì)新的挑戰(zhàn)。
當(dāng)然,改變不可能一蹴而就,但對(duì)于安全方面的專(zhuān)業(yè)人士而言,是時(shí)候考慮這個(gè)問(wèn)題了,如果他們考慮購(gòu)買(mǎi)新工具的時(shí)候腦子里能有這個(gè)想法就再好不過(guò)了。數(shù)據(jù)已經(jīng)開(kāi)始呈幾何趨勢(shì)增長(zhǎng),所以研發(fā)出一個(gè)新的基于線性數(shù)據(jù)掃描的工具應(yīng)該不是最佳的解決方法,至少已經(jīng)給供應(yīng)商帶來(lái)了一些棘手的問(wèn)題。相反,它可能會(huì)加速像文件加密等操作的使用,基于線性數(shù)據(jù)掃描的技術(shù)出現(xiàn)后,這些技術(shù)使用率就都在逐步攀升。想一次性為EB級(jí)別的數(shù)據(jù)加密可能不是那么容易的事情,但是,如果該操作是在數(shù)據(jù)大規(guī)模增長(zhǎng)前適時(shí)進(jìn)行的呢,這種情況下會(huì)怎樣? 這樣的話,就可能是另一碼事了。
幸好我們還有時(shí)間去應(yīng)對(duì)。在問(wèn)題變得更加棘手之前還有時(shí)間調(diào)整我們的操作和控制程序。但想一想虛擬化進(jìn)程的速度是何等之快,這個(gè)問(wèn)題可能會(huì)比我們預(yù)計(jì)地更早地出現(xiàn)。所以,花些時(shí)間想這個(gè)問(wèn)題是有意義的。
作者:Ed Moyle,Savvis公司高級(jí)安全策劃師,Security Curve公司合伙創(chuàng)始人,為客戶(hù)提供戰(zhàn)略,咨詢(xún)和解決方案。其在計(jì)算機(jī)領(lǐng)域的嵌入式開(kāi)發(fā)測(cè)試、信息安全審計(jì)和安全解決方案開(kāi)發(fā)等方面有著豐富的經(jīng)驗(yàn)。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開(kāi)啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書(shū)) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶(hù) ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱(chēng) BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢(xún)到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢(xún)結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢(xún)結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專(zhuān)注于從單 ...
2025-07-09year_month數(shù)據(jù)類(lèi)型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類(lèi)型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專(zhuān)業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04