
大數(shù)據(jù)時(shí)代 這些問(wèn)題待解決
在網(wǎng)絡(luò)時(shí)代的今天,數(shù)據(jù)信息是否安全時(shí)刻觸動(dòng)著每個(gè)人的心弦。有關(guān)專家告訴《中國(guó)科學(xué)報(bào)》記者,盡管大數(shù)據(jù)已使用多年,但在技術(shù)監(jiān)管領(lǐng)域,各環(huán)節(jié)仍存在諸多技術(shù)難點(diǎn)。
數(shù)據(jù)來(lái)源是否可靠待鑒定
據(jù)了解,此次大數(shù)據(jù)安全整治檢查中一項(xiàng)重點(diǎn)工作是對(duì)合法采集內(nèi)容與非法采集內(nèi)容進(jìn)行分類。其中,對(duì)于非法采集信息,將進(jìn)行集中打擊、銷毀;對(duì)合法、合規(guī)采集的信息,則納入保護(hù)監(jiān)管范圍。
浙江大學(xué)網(wǎng)絡(luò)空間安全研究中心主任任奎表示,從網(wǎng)絡(luò)安全的角度來(lái)看,首先,大數(shù)據(jù)在采集的過(guò)程中一方面需要考慮對(duì)數(shù)據(jù)源進(jìn)行認(rèn)證,確保數(shù)據(jù)本身的可靠性,如何在不增加負(fù)荷的情況下,特別是針對(duì)物聯(lián)網(wǎng)中計(jì)算處理能力相對(duì)較弱的設(shè)備,實(shí)現(xiàn)有效的認(rèn)證還有待研究。另一方面需要重視隱私保護(hù),如何有效地對(duì)數(shù)據(jù)進(jìn)行脫敏仍然存在挑戰(zhàn),當(dāng)前比較熱門的方法諸如差分隱私技術(shù)仍在積極發(fā)展中。
“公民的信息是公民的私有財(cái)產(chǎn),如果不對(duì)數(shù)據(jù)進(jìn)行溯源來(lái)證明數(shù)據(jù)來(lái)源渠道,那么很可能助長(zhǎng)非法數(shù)據(jù)來(lái)源的氣焰?!鄙虾=煌ù髮W(xué)計(jì)算機(jī)科學(xué)與工程系教授朱浩瑾說(shuō)。
中國(guó)科學(xué)院信息工程研究所DCS中心副研究員王躍武告訴記者,對(duì)于大數(shù)據(jù)而言,關(guān)鍵還是盡量將技術(shù)做到更完善,來(lái)保證數(shù)據(jù)分析結(jié)果的真實(shí)性、可靠性。
非關(guān)系型數(shù)據(jù)庫(kù)為數(shù)據(jù)存儲(chǔ)主流
提及目前大數(shù)據(jù)存儲(chǔ)環(huán)節(jié)存在的問(wèn)題,任奎告訴記者,目前的主要問(wèn)題是如何在有效保護(hù)數(shù)據(jù)的前提下,完整支持傳統(tǒng)的功能,諸如常見的搜索、排序、聚合分析等,當(dāng)前相關(guān)安全技術(shù)與明文應(yīng)用相比,尚存在功能和性能上的差距,有待提高。
“此外,還應(yīng)該考慮如何進(jìn)行安全去重等實(shí)際需求,從而減輕數(shù)據(jù)存儲(chǔ)的壓力,但這與‘備份’這種主動(dòng)的防災(zāi)機(jī)制是不同的,相關(guān)安全技術(shù)在安全與性能的平衡方面仍然需要進(jìn)一步研究?!比慰a(bǔ)充道。
采訪中,針對(duì)大數(shù)據(jù)的存儲(chǔ)技術(shù),王躍武與任奎一致認(rèn)為,從軟件層面比較主流的是基于分布式系統(tǒng)的非關(guān)系型數(shù)據(jù)庫(kù)。
據(jù)了解,非關(guān)系型數(shù)據(jù)庫(kù)的優(yōu)點(diǎn)主要在于易擴(kuò)展、高性能等,但是也存在諸如標(biāo)準(zhǔn)化不足、功能支持不夠豐富等缺點(diǎn)。常見的分類有鍵值存儲(chǔ)、列存儲(chǔ)、文檔存儲(chǔ)以及圖存儲(chǔ)。但是,如何權(quán)衡實(shí)際應(yīng)用中的需求,比如系統(tǒng)的一致性、可用性以及分區(qū)容錯(cuò)性等,并提供定制化的技術(shù),仍有大量工作要做。
如何避免“中間人”的攻擊?
任奎表示,數(shù)據(jù)在網(wǎng)絡(luò)中進(jìn)行傳輸,也需要防止監(jiān)聽、篡改這類傳統(tǒng)的“中間人”攻擊等,因此端到端加密是很有必要的。但是,端到端加密技術(shù)仍然面臨很多新型側(cè)信道攻擊來(lái)窺探隱私的挑戰(zhàn),尤其是最近一些以人工智能方法來(lái)展開的側(cè)信道分析工作也說(shuō)明了這一領(lǐng)域仍然有很多問(wèn)題需要解決?!俺艘酝猓藢?duì)端加密雖然好用,但同時(shí)也給網(wǎng)絡(luò)入侵檢測(cè)、加密數(shù)據(jù)防火墻的設(shè)計(jì)帶來(lái)更多的挑戰(zhàn),如何安全、高效地支持這類應(yīng)用還需要進(jìn)一步研究。”任奎說(shuō)。
360安全專家劉洋曾在接受記者采訪時(shí)表示,傳統(tǒng)的網(wǎng)絡(luò)安全思路已經(jīng)無(wú)法保障大數(shù)據(jù)時(shí)代的安全。傳統(tǒng)網(wǎng)絡(luò)安全的防護(hù)思路是劃分邊界,將內(nèi)網(wǎng)、外網(wǎng)分開,業(yè)務(wù)網(wǎng)和公眾網(wǎng)分離,用終端設(shè)備將潛在風(fēng)險(xiǎn)隔離。通過(guò)在每個(gè)邊界設(shè)立網(wǎng)關(guān)設(shè)備和網(wǎng)絡(luò)流量設(shè)備來(lái)守住“邊界”,以期解決安全問(wèn)題。但隨著移動(dòng)互聯(lián)網(wǎng)、云服務(wù)的出現(xiàn),移動(dòng)終端在4G信號(hào)、Wi-Fi信號(hào)、電纜之間穿梭,網(wǎng)絡(luò)邊界實(shí)際上已經(jīng)消亡。
大數(shù)據(jù)銷毀并非簡(jiǎn)單的“刪除”“清空”
在朱浩瑾看來(lái),在我國(guó),數(shù)據(jù)銷毀仍是一個(gè)不小的問(wèn)題。他指出,歐盟出臺(tái)的《通用數(shù)據(jù)保護(hù)條例》中明文規(guī)定了用戶的“被遺忘權(quán)”,即用戶個(gè)人可以要求責(zé)任方刪除關(guān)于自己的數(shù)據(jù)記錄,而國(guó)內(nèi)的法律無(wú)此規(guī)定。此外,企業(yè)究竟有無(wú)對(duì)數(shù)據(jù)進(jìn)行銷毀,在技術(shù)上并不好驗(yàn)證?!氨热缒愕氖謾C(jī)移動(dòng)端可以進(jìn)行一些設(shè)置,但是服務(wù)器端你怎么知道有沒有銷毀?”朱浩瑾補(bǔ)充道。
任奎指出,大數(shù)據(jù)的銷毀是實(shí)現(xiàn)數(shù)據(jù)有效管理的必要過(guò)程,其過(guò)程并非簡(jiǎn)單的“刪除”“清空”,如何保證指定的內(nèi)容確實(shí)被“清除”與“銷毀”,除了技術(shù)層面的發(fā)展,仍需要建立行之有效的規(guī)范,例如美國(guó)國(guó)防部的DoD 5220.22-M規(guī)范。
對(duì)此,王躍武表達(dá)了不同意見。他表示,大數(shù)據(jù)時(shí)代,數(shù)據(jù)來(lái)源是一個(gè)由線到面的過(guò)程,銷毀從本質(zhì)上來(lái)講是一種消極的做法?!按髷?shù)據(jù)如同金礦,我們盡力從中淘出金子,然后將其保護(hù)好,這才是我們?cè)撟龅??!蓖踯S武說(shuō)。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10CDA 數(shù)據(jù)分析師:商業(yè)數(shù)據(jù)分析實(shí)踐的落地者與價(jià)值創(chuàng)造者 商業(yè)數(shù)據(jù)分析的價(jià)值,最終要在 “實(shí)踐” 中體現(xiàn) —— 脫離業(yè)務(wù)場(chǎng)景的分 ...
2025-09-10