
大數(shù)據(jù)興起 重復(fù)數(shù)據(jù)刪除4項(xiàng)注意
根據(jù)全球市場(chǎng)的反饋來(lái)看,IT技術(shù)推動(dòng)公司的歷程性進(jìn)步,繼續(xù)著信息革命時(shí)代的傳奇。重復(fù)數(shù)據(jù)刪除技術(shù)目前已成為存儲(chǔ)行業(yè)最為熱門的技術(shù),不僅眾多廠商極力推薦其重復(fù)數(shù)據(jù)刪除產(chǎn)品,廣大用戶也在熱切的關(guān)注著重復(fù)數(shù)據(jù)刪除技術(shù)。
從全球企業(yè)界興起的這種熱鬧局面,主要是由當(dāng)前經(jīng)濟(jì)大環(huán)境不景氣的外部原因,以及企業(yè)自身數(shù)據(jù)飛速增長(zhǎng)的內(nèi)部原因共同形成。作為重復(fù)數(shù)據(jù)刪除產(chǎn)品越來(lái)越受用戶關(guān)注的同時(shí),其功能作用也被過(guò)分的放大,成為廠商推銷其產(chǎn)品的賣點(diǎn)和噱頭。就此問(wèn)題,用戶在選擇重復(fù)數(shù)據(jù)刪除產(chǎn)品時(shí)還需要謹(jǐn)慎起見(jiàn)。
重復(fù)數(shù)據(jù)刪除對(duì)你是否有意義?
那用戶首先需要問(wèn)自己的就是是否真的需要重復(fù)數(shù)據(jù)刪除技術(shù)。就目前的一些調(diào)查情況來(lái)看:一些類似醫(yī)療影像處理的數(shù)據(jù)并不適合進(jìn)行重復(fù)數(shù)據(jù)刪除,另外金融、電信等對(duì)數(shù)據(jù)可靠性要求比較高的行業(yè)對(duì)重復(fù)數(shù)據(jù)刪除也需要謹(jǐn)慎對(duì)待。用戶如果趕時(shí)髦、追潮流,不考慮自身企業(yè)的數(shù)據(jù)情況,購(gòu)買重復(fù)數(shù)據(jù)刪除產(chǎn)品只能取得適得其反的結(jié)果。
事實(shí)上,這種只保存數(shù)據(jù)單一實(shí)例的技術(shù)早已存在,只是在備份領(lǐng)域中才被突顯出來(lái),并定名為重復(fù)數(shù)據(jù)刪除。正是由于企業(yè)在備份過(guò)程中存儲(chǔ)了大量的重復(fù)數(shù)據(jù)、浪費(fèi)了大量存儲(chǔ)空間,最終才催化出重復(fù)數(shù)據(jù)刪除技術(shù)。重復(fù)數(shù)據(jù)刪除的宗旨就是為企業(yè)用戶的備份解決方案服務(wù),使得企業(yè)備份解決方案更加完善、高效。如果脫離這個(gè)宗旨,廠商一味強(qiáng)調(diào)重復(fù)數(shù)據(jù)刪除的一些優(yōu)點(diǎn),卻忽視企業(yè)在數(shù)據(jù)安全性和備份等方面可能做出的巨大犧牲,那么毫無(wú)疑問(wèn),這種本末倒置的作法最終受害的將是用戶。
因此,用戶在選購(gòu)重復(fù)數(shù)據(jù)刪除產(chǎn)品時(shí)需要思考重復(fù)數(shù)據(jù)刪除是否對(duì)你有意義?你的企業(yè)是否真的需要重復(fù)數(shù)據(jù)刪除?如果廠商不顧你的現(xiàn)實(shí)情況,不負(fù)責(zé)任的向你推銷其重復(fù)數(shù)據(jù)刪除產(chǎn)品,那么恭喜你,你遇到“騙子”了……
重復(fù)數(shù)據(jù)刪除對(duì)現(xiàn)有備份環(huán)境是否造成影響?影響有多大?
企業(yè)用戶備份做兩次全備份時(shí)間間隔一般不長(zhǎng),通常只有不超過(guò)5%的數(shù)據(jù)是不同的,剩余大部分?jǐn)?shù)據(jù)都是相同的,因此,重復(fù)數(shù)據(jù)刪除絕對(duì)可以給企業(yè)備份系統(tǒng)帶來(lái)很大的好處。從而衍生出這樣一個(gè)問(wèn)題:重復(fù)數(shù)據(jù)刪除是否會(huì)對(duì)企業(yè)現(xiàn)有備份環(huán)境造成影響?可能會(huì)造成什么樣的影響?這種影響有多大?
如果你的備份環(huán)境已經(jīng)有比較長(zhǎng)的時(shí)間了,各項(xiàng)備份機(jī)制都趨于完善,這個(gè)時(shí)候你應(yīng)該考慮加入重復(fù)數(shù)據(jù)刪除解決方案。那么你要選擇什么樣的重復(fù)數(shù)據(jù)刪除產(chǎn)品呢?是選擇在線處理方式(In-line)的重復(fù)數(shù)據(jù)刪除產(chǎn)品,還是選擇后處理方式(Post-Processing)的重復(fù)數(shù)據(jù)刪除產(chǎn)品呢?這里需要告誡你的是:In-line方式可能并不適合你當(dāng)前的備份環(huán)境。因?yàn)镮n-line方式可能給你的備份環(huán)境帶來(lái)很大的改變,不僅可能你的備份軟件需要升級(jí)、備份設(shè)備需要更換,還可能出現(xiàn)備份機(jī)制、備份習(xí)慣的通通改變。更有可能出現(xiàn),改變現(xiàn)有備份環(huán)境會(huì)使備份處理的速度變的很慢,甚至引發(fā)無(wú)法預(yù)計(jì)且不可恢復(fù)的數(shù)據(jù)丟失。所以如果用戶不仔細(xì)考慮重復(fù)數(shù)據(jù)刪除產(chǎn)品對(duì)現(xiàn)有備份環(huán)境的影響,則很可能將已有的備份環(huán)境做出巨大改變,而這種巨大的改變也犯了IT建設(shè)之大忌。
因此,用戶在選購(gòu)重復(fù)數(shù)據(jù)刪除產(chǎn)品之前必須對(duì)所選產(chǎn)品對(duì)現(xiàn)有備份環(huán)境的影響進(jìn)行評(píng)估,盡量選擇那些對(duì)已有備份環(huán)境沒(méi)有影響的產(chǎn)品。
單一不重復(fù)數(shù)據(jù)的安全性該如何保障?
當(dāng)用戶選擇好重復(fù)數(shù)據(jù)刪除產(chǎn)品進(jìn)行重復(fù)數(shù)據(jù)刪除操作后會(huì)猛然發(fā)現(xiàn)這么一個(gè)問(wèn)題:進(jìn)行完重復(fù)數(shù)據(jù)刪除后,我的數(shù)據(jù)只剩下單一不重復(fù)數(shù)據(jù),更為要命的是單一不重復(fù)數(shù)據(jù)是集中保存在一個(gè)存儲(chǔ)區(qū)域中。單一不重復(fù)數(shù)據(jù)的安全性瞬間就成為用戶最為棘手問(wèn)題,用戶會(huì)發(fā)現(xiàn)自己把寶都押在同一個(gè)地方,仿佛就是把所有雞蛋都放在了同一個(gè)籃子里。這時(shí)候,VTL在重復(fù)數(shù)據(jù)刪除解決方案中的重要性就顯現(xiàn)出來(lái)了。用戶可以在VTL中再拷貝一份單一不重復(fù)數(shù)據(jù),還可以通過(guò)遠(yuǎn)程鏡像技術(shù)將數(shù)據(jù)鏡像到不同地域的不同存儲(chǔ)設(shè)備上。另外,還可以通過(guò)這種高可用性(HA)架構(gòu)來(lái)消除單點(diǎn)故障(SPOF),提高VTL系統(tǒng)自身的高可靠性,使整個(gè)備份系統(tǒng)更安全。
你想把自己所有雞蛋都放在一個(gè)籃子里,然后終日過(guò)著如履薄冰、膽戰(zhàn)心驚、誠(chéng)惶誠(chéng)恐的日子嗎?如果不想,那么請(qǐng)你在選擇重復(fù)數(shù)據(jù)刪除解決方案時(shí),仔細(xì)思考一下單一不重復(fù)數(shù)據(jù)安全的安全性問(wèn)題!如果廠商解決方案不能夠很好解決這個(gè)重要問(wèn)題,毫無(wú)疑問(wèn)的恭喜你,你可能又遇到一個(gè)“大忽悠”!
擴(kuò)展性與成本對(duì)于重復(fù)數(shù)據(jù)刪除技術(shù)很重要嗎?
用戶選擇了重復(fù)數(shù)據(jù)刪除技術(shù)并不意味著以后就萬(wàn)事大吉,數(shù)據(jù)量該增長(zhǎng)還得增長(zhǎng),存儲(chǔ)容量該增加還得增加,用戶還得去面對(duì)存儲(chǔ)解決方案可擴(kuò)展性的問(wèn)題。
從長(zhǎng)遠(yuǎn)的角度來(lái)看,單臺(tái)重復(fù)數(shù)據(jù)刪除設(shè)備根本無(wú)法滿足企業(yè)的需求,企業(yè)將來(lái)也必然會(huì)面對(duì)多臺(tái)重復(fù)數(shù)據(jù)刪除設(shè)備,這就凸現(xiàn)出下面的情況:企業(yè)考慮用多臺(tái)重復(fù)數(shù)據(jù)刪除設(shè)備來(lái)完成備份,那么每臺(tái)重復(fù)數(shù)據(jù)刪除設(shè)備能否識(shí)別自身已備份的數(shù)據(jù)在其他設(shè)備上是否也已經(jīng)備份了?出現(xiàn)這種情況是否會(huì)影響到整個(gè)備份系統(tǒng)的重復(fù)數(shù)據(jù)刪除比?是否會(huì)增加維護(hù)的難度?
因此企業(yè)將來(lái)面對(duì)的集群架構(gòu)必須具有良好的擴(kuò)展能力和集群式的重復(fù)數(shù)據(jù)刪除技術(shù)。集群架構(gòu)應(yīng)該是通過(guò)統(tǒng)一性的添加VTL節(jié)點(diǎn)來(lái)擴(kuò)展,還需要能夠做到任意時(shí)間添加存儲(chǔ)而不出現(xiàn)中斷處理的情況。只有這樣才能夠具有最優(yōu)的管理能力和擴(kuò)展能力。如果廠商不能夠提供很好的擴(kuò)展方案,那么極易形成備份孤島,那時(shí),用戶的設(shè)備采購(gòu)成本、管理復(fù)雜性和管理成本都將加大的增加。
綜上所述,用戶選購(gòu)重復(fù)數(shù)據(jù)刪除產(chǎn)品時(shí),應(yīng)該以正確的心態(tài)去面對(duì)它,本文上面提到重復(fù)數(shù)據(jù)刪除產(chǎn)品選購(gòu)四大注意事項(xiàng):重復(fù)數(shù)據(jù)刪除是否對(duì)你有意義、重復(fù)數(shù)據(jù)刪除對(duì)現(xiàn)有備份環(huán)境有多大影響、重復(fù)數(shù)據(jù)安全性如何保障、重復(fù)數(shù)據(jù)刪除的擴(kuò)展性和成本,正是從用戶自身角度來(lái)看待重復(fù)數(shù)據(jù)刪除產(chǎn)品。專家表示,相信用戶只要很好的遵循這四個(gè)角度去選購(gòu)重復(fù)數(shù)據(jù)刪除產(chǎn)品,一定能夠選購(gòu)到最適合自己的產(chǎn)品,也一定能夠讓用戶的備份環(huán)境得到更好的優(yōu)化。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10