
企業(yè)備份系統(tǒng)建設(shè)必須考慮的幾個關(guān)鍵性問題
對于每一個企業(yè)來講,數(shù)據(jù)備份都是必不可少的一項關(guān)鍵性工作,它直接決定著企業(yè)能夠應(yīng)對什么樣的數(shù)據(jù)威脅以及相應(yīng)解決方案的靈活度和有效性。但是在IT飛速發(fā)展的今天,每一個企業(yè)的應(yīng)用系統(tǒng)在不斷增加,數(shù)據(jù)類型在不斷的多樣化,數(shù)據(jù)的量級也在不斷的擴展。在這種形勢下,如何能把備份系統(tǒng)規(guī)劃的科學(xué)合理并且高效化是作為IT建設(shè)者必須考慮的問題。
本文通過大量的調(diào)研分析總結(jié)抽象出備份系統(tǒng)規(guī)劃時必須考慮的幾個關(guān)鍵性問題,并針對每一個問題進行分析和論述,提出解決思路。希望能給企業(yè)進行備份系統(tǒng)建設(shè)、改造或者升級的項目帶來一些啟示和幫助。
1.如何確定備份對象及備份策略
近些年來,企業(yè)的數(shù)據(jù)逐漸呈現(xiàn)多元化格局,從數(shù)據(jù)的模型層面可以分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)。從企業(yè)IT功能層面又可以將常見數(shù)據(jù)列為如下幾類:
作為企業(yè)來講,確定備份哪些數(shù)據(jù)對象,需要從數(shù)據(jù)重要性、數(shù)據(jù)量、數(shù)據(jù)特點等若干方面去評估。從企業(yè)業(yè)務(wù)角度評估的話,那么數(shù)據(jù)庫保存的數(shù)據(jù)一定是最重要的,尤其是關(guān)系型數(shù)據(jù)庫里面的二維表數(shù)據(jù)。其次需要根據(jù)行業(yè)特點以及具體的業(yè)務(wù)系統(tǒng)重要性來評估非結(jié)構(gòu)化數(shù)據(jù)的重要性。
比如對于金融行業(yè)來講,記錄業(yè)務(wù)過程的一些影像類數(shù)據(jù)可能在業(yè)務(wù)審核過程中經(jīng)常被調(diào)出查閱,這些數(shù)據(jù)雖然沒有結(jié)構(gòu)化數(shù)據(jù)那么重要但是也是業(yè)務(wù)環(huán)節(jié)當(dāng)中比不可少的元素,其重要性相對業(yè)務(wù)視頻類以及安防類視頻數(shù)據(jù)會高很多。但是如果是媒體行業(yè)的話,那么視頻類數(shù)據(jù)的重要性恰恰是支撐其業(yè)務(wù)的核心數(shù)據(jù),其重要程度不言而喻。那么如何來決定哪些數(shù)據(jù)需要備份,以什么樣的策略備份?
首先,我們需要確定數(shù)據(jù)的重要性程度。本文通過結(jié)果導(dǎo)向的思路從以下維度來分析企業(yè)數(shù)據(jù)的重要性,最終決定哪些數(shù)據(jù)需要備份,哪些數(shù)據(jù)可以不備份,哪些數(shù)據(jù)需要根據(jù)企業(yè)的實際投資戰(zhàn)略情況來決定。
首先我們假定一個結(jié)果,那就是某個應(yīng)用系統(tǒng)的某類型數(shù)據(jù)由于硬件故障或者其他原因?qū)е聰?shù)據(jù)丟失掉了。那么就看企業(yè)對該結(jié)果的容忍程度,假設(shè)不能容忍,那么就沒什么好商量的了,肯定要做備份。接下來,最重要的事情是我們?nèi)绾味x數(shù)據(jù)備份的策略,包括備份的頻度、備份的模式、歸檔的檔期等等一系列備份作業(yè)元素。這部分內(nèi)容需要考慮到數(shù)據(jù)本身的量級、數(shù)據(jù)的具體類型、極端條件下對數(shù)據(jù)恢復(fù)時間及數(shù)據(jù)丟失量的容忍程度、數(shù)據(jù)備份系統(tǒng)以及備份介質(zhì)本身的性能特性、業(yè)務(wù)發(fā)展的規(guī)模及趨勢判斷等等。
本文從以下幾個原則來進行評估:
以上是對備份對象的確定以及如何把握具體的備份策略的分析和描述,具體細節(jié)及關(guān)鍵方法在接下來的章節(jié)會有詳細的剖析和介紹。
2.如何選擇備份架構(gòu)的問題
2.1 備份系統(tǒng)涉及到的關(guān)鍵對象
所謂備份系統(tǒng)中的一些關(guān)鍵對象包括:備份軟件、備份介質(zhì)、備份管理服務(wù)器、備份作業(yè)服務(wù)器、備份路徑等。這些關(guān)鍵元素共同組成了一個完成的備份系統(tǒng)。
2.2 基于容災(zāi)功能的備份架構(gòu)
一般的企業(yè)可能只需要進行本地備份即可,但是對于某些行業(yè)尤其是金融行業(yè),備份要求比較高,需要采用主數(shù)據(jù)中心和備數(shù)據(jù)中心聯(lián)動的高可用備份架構(gòu)。具體如下圖所示:
整體架構(gòu)從上到下分為三層:備份客戶端層、備份控制層以及數(shù)據(jù)存儲層。中間通過網(wǎng)絡(luò)(以太網(wǎng)絡(luò)或者是光纖網(wǎng)絡(luò))相連接。紅色線表示控制信息流向,藍色線表示備份過程中的數(shù)據(jù)流向。
2.3 備份架構(gòu)高可用性分析
整個備份系統(tǒng)的高可用性是由每一個部分服務(wù)的高可用配置來保障的,主要包括備份控制層、備份存儲介質(zhì)層以及跨數(shù)據(jù)中心級別的高可用架構(gòu)配置。下面我們分別來做剖析:
3.如何解決非結(jié)構(gòu)化數(shù)據(jù)備份的問題
3.1 非結(jié)構(gòu)化數(shù)據(jù)備份面臨的困境
對于存儲在傳統(tǒng)NAS文件系統(tǒng)上的文件類數(shù)據(jù),如果用通用的備份方法只能通過文件復(fù)制的方式來實現(xiàn)其全量和增量備份。但是隨著日積月累的非結(jié)構(gòu)化數(shù)據(jù)增長,這類數(shù)據(jù)可能會從TB級別發(fā)展到10TB甚至PB級別。這類數(shù)據(jù)存儲組織的方式是文件系統(tǒng)的樹目錄形式,隨著數(shù)據(jù)的增加,其目錄的深度和規(guī)模也會呈現(xiàn)劇增趨勢。備份軟件在掃描文件目錄的時候會變得非常非常慢,最終導(dǎo)致備份作業(yè)慢到超過備份窗口的程度。
3.2 業(yè)務(wù)管理層面的解決方案
如果從業(yè)務(wù)管理層面來解決該問題的話,那么就是要讓備份作業(yè)在一定時間段內(nèi)保持在合理的數(shù)據(jù)量范圍之內(nèi),也就是說要形成合理的多級數(shù)據(jù)緩存,根據(jù)數(shù)據(jù)使用頻度建立多級轉(zhuǎn)儲以及歸檔體系。保障使用頻度高的數(shù)據(jù)在日常備份作業(yè)范圍內(nèi),合理歸檔使用頻率非常低的歷史數(shù)據(jù)。拿金融行業(yè)的票據(jù)、信貸類系統(tǒng)來說,我們可以將合理業(yè)務(wù)周期內(nèi)的非結(jié)構(gòu)化數(shù)據(jù)存在在一級緩存當(dāng)中,保障業(yè)務(wù)復(fù)核階段的數(shù)據(jù)讀?。粚I(yè)務(wù)周期外的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)儲到二級NAS平臺上,保障近期內(nèi)可能使用到的業(yè)務(wù)場景;將較長周期之前的數(shù)據(jù)定義為離線數(shù)據(jù),歸檔到歸檔存儲設(shè)備當(dāng)中。備份僅僅涉及到歸檔之前的數(shù)據(jù)。這樣既可以保障數(shù)據(jù)存取的性能,又能保障備份作業(yè)的長期穩(wěn)定性,最終保障備份系統(tǒng)整體的安全穩(wěn)定。
3.3 技術(shù)管理層面的解決方案
通過3.1章節(jié)對問題的原因分析,我們知道導(dǎo)致備份無法進行的原因在于備份軟件對于龐大文件系統(tǒng)目錄的掃描時間過長。那么順著這個思路,如果我們在備份的時候能避免去掃描整個文件系統(tǒng)目錄,而是通過別的方式來完成備份,就可以解決這個問題。通過調(diào)查研究我們發(fā)現(xiàn)目有兩種方法可以實現(xiàn):
1)傳統(tǒng)NAS的快照方式。對于傳統(tǒng)的NAS存儲來講,快照是非常普遍的功能,通過NAS本身的快照復(fù)制,我們可以不用掃描文件系統(tǒng)沒目錄,僅僅基于某一個時刻點的快照,進行卷級別的復(fù)制實現(xiàn)全量備份;通過塊兒級別的對比實現(xiàn)增量備份,因為NAS設(shè)備底層還是基于塊兒設(shè)備實現(xiàn)的。當(dāng)然這種技術(shù)需要對存儲本身的快照功能有非常強的依賴性。
2)分布式NAS存儲的日志記錄方式。某些基于分布式技術(shù)實現(xiàn)的NAS存儲可以對外提供日志操作的接口,也就是說對文件數(shù)據(jù)的增加和更新會記錄到存儲本身的底層日志當(dāng)中,那么我們僅僅需要調(diào)用日志比對的接口就可以快速找到更新的目錄和文件,僅僅需要掃描更新的部分做增量的復(fù)制來完成備份。
以上的兩種技術(shù)方案需要我們在做備份規(guī)劃之前的選型階段對不同的備份軟件及存儲介質(zhì)等進行深度調(diào)研和分析,盡可能科學(xué)合理組合實現(xiàn)以上解決方案。
4.如何解決平衡數(shù)據(jù)庫歸檔頻度和數(shù)據(jù)恢復(fù)完整性
4.1 數(shù)據(jù)庫恢復(fù)的基本原理
對于數(shù)據(jù)庫的恢復(fù)來說有很多種,我們只討論需要介質(zhì)恢復(fù)的情況。在這種場合下,首先我們需要找到一個最近時刻點的全量備份進行恢復(fù);然后需要從備份介質(zhì)上找到這個時刻點之后的重做日志進行數(shù)據(jù)追平,最后我們需要找到本地沒有丟失的重做日志進行再次追平直到?jīng)]有可用日志。如下圖所示:
如圖所示,在時刻A,我們開始做在線全庫備份,在B時刻全庫備份結(jié)束。當(dāng)數(shù)據(jù)庫運行到E時刻之后數(shù)據(jù)庫發(fā)生了重大介質(zhì)故障,只能通過介質(zhì)恢復(fù)。那么在A~C時間段內(nèi),大部分REDO日志文件都已經(jīng)歸檔到備份介質(zhì)池當(dāng)中,服務(wù)器本地存儲目錄當(dāng)中只剩下C~E(小于一個歸檔備份時間間隔)的歸檔日志和沒有來得及歸檔的REDO日志文件。
假設(shè)發(fā)生的故障嚴重到服務(wù)器本地存儲目錄也無法恢復(fù)的時候,那么相當(dāng)于在C-E這段時間產(chǎn)生的重做日志就丟失掉了。相當(dāng)在這種極端場合下,數(shù)據(jù)丟失的最大窗口就是一個歸檔間隔時間段。當(dāng)然如果把這個間隔設(shè)置的足夠小的話,那么另外的問題就產(chǎn)生了,備份作業(yè)隨著系統(tǒng)增加會呈爆發(fā)式并發(fā)啟動狀態(tài),最終會影響到整個備份系統(tǒng)的健康運行導(dǎo)致歸檔無法及時轉(zhuǎn)儲,最終還是可能會導(dǎo)致數(shù)據(jù)庫的宕機。這就是一個矛盾,需要我們?nèi)ズ芎玫钠胶狻?
4.2 平衡數(shù)據(jù)庫歸檔頻率的方法
數(shù)據(jù)庫歸檔備份的頻率是指一天24小時內(nèi)間隔多長時間進行一次歸檔日志的備份,一方面是要保障增量數(shù)據(jù)備份的完整性,另外一方面是要避免因為恢復(fù)空間不足導(dǎo)致數(shù)據(jù)庫的宕機時間。要平衡這個頻率窗口需要采集以下幾類數(shù)據(jù):
1)單位時間內(nèi)不同數(shù)據(jù)庫系統(tǒng)平均的歸檔日志量。
采集這個數(shù)據(jù)的目的在于詳細分析不同業(yè)務(wù)系統(tǒng)在不同時間段的寫操作頻繁程度。對于日志歸檔速度較快的系統(tǒng),我們需要提高其恢復(fù)區(qū)的空間大小,同時加快歸檔備份的頻率,使得數(shù)據(jù)庫既能處于安全運行狀態(tài)又能保障極端故障場合下數(shù)據(jù)丟失的量在較小范圍之內(nèi)。
2)業(yè)務(wù)系統(tǒng)類型。
所謂業(yè)務(wù)系統(tǒng)類型即OLTP或者是OLAP,因為對于OLAP來講,每次的讀寫操作都會是批量的執(zhí)行,它的歸檔速度是正常OLAP系統(tǒng)的幾十倍甚至上百倍。最麻煩的是兩者皆有的業(yè)務(wù)系統(tǒng),比如說銀行業(yè)中的交易系統(tǒng),白天跑聯(lián)機交易,晚上跑核算批量,白天和晚上的日志歸檔速度有著巨大的反差。那么我們就需要在批量作業(yè)時間段內(nèi)將備份頻率調(diào)快,將恢復(fù)區(qū)空間設(shè)置提高。
3)備份系統(tǒng)可以容忍的最大并發(fā)量。
備份系統(tǒng)可以容忍的最大并發(fā)Jobs,不僅僅取決于備份軟件系統(tǒng)可以并發(fā)調(diào)度的作業(yè)數(shù)目和備份作業(yè)服務(wù)器的數(shù)目,還要取決于備份介質(zhì)池可以容忍的資源消耗限制。及時我們可以同時調(diào)度幾百個作業(yè),但是當(dāng)幾十個作業(yè)同時寫入備份介質(zhì)池時就會把備份介質(zhì)池的計算資源或者是IO資源使用殆盡。那么最終整個備份系統(tǒng)的并發(fā)數(shù)取決于短板因素。
4)不同數(shù)據(jù)庫系統(tǒng)恢復(fù)區(qū)能夠支撐最小時間窗口。
這個最小時間窗口是我們用數(shù)據(jù)庫的恢復(fù)區(qū)可用空間大小/單位時間內(nèi)的最大歸檔速度來估算出來的時間窗口。因為我們在安裝數(shù)據(jù)庫或者是做變更的時候不可能按照每一個系統(tǒng)的特點詳細計算出其日志存儲空間的大小,只能按照有限的幾個規(guī)格來做初始規(guī)劃。
有了以上數(shù)據(jù)之后,我們需要根據(jù)以下幾個原則來詳細設(shè)計我們的歸檔作業(yè)頻率。
首先,根據(jù)4當(dāng)中采集到的數(shù)據(jù),將時間窗口較小的幾個系統(tǒng)進行存儲空間調(diào)整,使其日志存儲空間能夠滿足我們期望的最小時間標(biāo)準(zhǔn)。
然后,將一天24小時定義為幾個時間段,批量業(yè)務(wù)集中的時間段、聯(lián)機業(yè)務(wù)集中的時間段、特殊任務(wù)集中的時間段等。當(dāng)然這個定義主要是根據(jù)1&2中采集到的詳細數(shù)據(jù)來定義的。
接著,我們需要根據(jù)1中數(shù)據(jù)估算出一個歸檔作業(yè)大概持續(xù)的時間長度。為保障每一個時刻點的并發(fā)執(zhí)行備份作業(yè)數(shù)目遠小于3中估算出來的數(shù)據(jù)。
最后,需要把備份作業(yè)的頻度根據(jù)不同的時間段特點調(diào)整到以上條件都滿足的狀態(tài),并在此前提條件下可以為了保障極端情況下的數(shù)據(jù)完整性而適當(dāng)調(diào)快歸檔作業(yè)的備份頻率。下圖是一個根據(jù)以上采集數(shù)據(jù)進行多維分析的實例,僅僅是一個方法示意,歸檔頻率根據(jù)數(shù)據(jù)重要性分級、歸檔速度、業(yè)務(wù)時間段分類等前提進行的粗略分析,最下面的一行數(shù)字表示每一個時刻點并發(fā)的歸檔備份數(shù)目,其目標(biāo)在于平衡每一個時間間隔內(nèi)的平均備份作業(yè)數(shù)。實際情況會比以下情況復(fù)雜很多,我們可以將時間間隔劃分的更小,涉及的因素更多,分析的更加細致。、
5.如何評估數(shù)據(jù)庫全量備份的策略
數(shù)據(jù)庫的全量備份來講,隨著數(shù)據(jù)量的不斷增加,其備份作業(yè)耗費的時間也就會越長,耗費的數(shù)據(jù)庫資源也越多,對在線業(yè)務(wù)的影響也就越大。另外同一個時間段內(nèi)發(fā)起的全量備份越多,那么其占用的備份系統(tǒng)整體資源(備份服務(wù)器、備份介質(zhì)池、鏈路帶寬等)也就會越多,其影響范圍也會越廣。
首先,這個問題是一個需要不斷優(yōu)化的問題。對于每一個應(yīng)用系統(tǒng)來講,根據(jù)業(yè)務(wù)服務(wù)的特點,其備份的時間窗口也是不同的??赡艹跗趥浞葑鳂I(yè)能夠在備份窗口內(nèi)完成,但是隨著數(shù)據(jù)量的增長,后期的備份作業(yè)就會超過備份時間窗口。所以我們需要定期監(jiān)控數(shù)據(jù)庫的全量備份作業(yè)時間,在事件窗口范圍內(nèi)盡量通過調(diào)整合適的調(diào)度時間來完成全量備份。但是當(dāng)數(shù)據(jù)量增長到完全沒辦法在備份窗口完成的時候,那么我們就需要進行調(diào)整全量備份的頻度和具體調(diào)度時間點了。
其次,這個問題是一個跟業(yè)務(wù)特點密切相關(guān)的的問題。有些人喜歡把所有的業(yè)務(wù)系統(tǒng)都按照一個標(biāo)準(zhǔn)去定義其數(shù)據(jù)庫全量備份的策略。比如說TB以下的數(shù)據(jù)庫,每天一次全量備份;比如說業(yè)務(wù)等級屬于重要的系統(tǒng),每天一次全量備份;比如說只要能備份的系統(tǒng),全部進行每天一次的全量備份等等策略。這些都是不科學(xué)的策略。應(yīng)該從業(yè)務(wù)系統(tǒng)的數(shù)據(jù)重要性去評估數(shù)據(jù)庫全量備分的頻率,在現(xiàn)有備份系統(tǒng)有限的處理能力內(nèi)保障數(shù)據(jù)重要性高的系統(tǒng)完成相應(yīng)的全量備份。
最后,這個問題是一個需要從各個方面著手去解決的問題。從備份網(wǎng)絡(luò)的帶寬和隔離性考慮,應(yīng)該用單獨的告訴備份網(wǎng)絡(luò),備份客戶端應(yīng)該設(shè)置區(qū)分于業(yè)務(wù)的單獨網(wǎng)絡(luò)通道及配置。從備份作業(yè)服務(wù)器的配置層面,我們應(yīng)該配置相對合理的資源(內(nèi)存、磁盤)來保障備份片在作業(yè)服務(wù)器層沒有瓶頸。從備份介質(zhì)池層面,我們需要保障備份介質(zhì)的IO處理能力不能成為備份作業(yè)底端的性能瓶頸。
6.如何解決備份作業(yè)分布合理性問題
其實這個問題很簡單,目的就是要保障備份時間窗口內(nèi)調(diào)度起來以及運行過程中的備份作業(yè)處于一種平衡狀態(tài),不能使其作業(yè)調(diào)用或者是并發(fā)運行過于集中。但是當(dāng)系統(tǒng)數(shù)目非常多,系統(tǒng)特點復(fù)雜,數(shù)據(jù)重要性級別有很多種,數(shù)據(jù)量以及數(shù)據(jù)增速各不相同時,這個問題就變得比較復(fù)雜。我們很難有一種精確的計算方法來實現(xiàn)其做到絕對,但是我們可以根據(jù)以下的方法進行定性的分析和調(diào)整。
假設(shè)我們定義一個系統(tǒng)的備份作業(yè)在備份體系當(dāng)中必須具備的屬性為:
P1 – 應(yīng)用系統(tǒng)數(shù)據(jù)的重要性級別屬性,可以通過業(yè)務(wù)分析劃分為有限的幾個級別。
P2 – 應(yīng)用系統(tǒng)在不同時間段內(nèi)的數(shù)據(jù)增量屬性,需要通過梳理歷史數(shù)據(jù)來評估。
P3 – 應(yīng)用系統(tǒng)當(dāng)前的備份作業(yè)的時間長度屬性,需要通過歷史數(shù)據(jù)結(jié)合數(shù)據(jù)量來評估。
P4 – 應(yīng)用系統(tǒng)是否是具備雙重業(yè)務(wù)特性,比如兼?zhèn)渑亢吐?lián)機業(yè)務(wù)特性。
通過以上幾個屬性的加權(quán)計算或者其他方法的定性分析,計算出每一個系統(tǒng)的不同備份作業(yè)的定性矢量,然后我們可以將這些矢量根據(jù)其具體備份窗口設(shè)置初始的調(diào)度時間點,然后分析其具體分布圖是否均衡穩(wěn)定并且進行微調(diào)。例如下圖是一個粗略的分析實例,可以提供相關(guān)的參考思路:
以上案例僅僅是一個相對粗略的分析方式,僅僅是一個基于某一特定案例的分析思路。我們可以根據(jù)業(yè)務(wù)系統(tǒng)特點結(jié)合更好的專業(yè)工具進行更加細節(jié)的分析。但是總體目標(biāo)是讓我們的備份作業(yè)分布達到一定范圍內(nèi)的平衡,另外在某些特定的業(yè)務(wù)場合或者特定的設(shè)備場合下,可能會有一些特殊的時間窗口需要和備份作業(yè)適當(dāng)分割開來,比如說基于文件系統(tǒng)技術(shù)實現(xiàn)的備份介質(zhì)存儲池,由于我們的周期性歸檔配置,它會定期去做文件系統(tǒng)的清理作業(yè),而且時間段比較長,耗費資源比較高。我們盡量要講備份作業(yè)的分布策略與這些時間段保持適當(dāng)?shù)姆指睢_@樣才會保證備份系統(tǒng)運行的長久安全穩(wěn)定。
7.如何解決業(yè)務(wù)發(fā)展與備份系統(tǒng)有限性瓶頸
所謂的業(yè)務(wù)發(fā)展在備份體系建設(shè)過程中包括幾個方面的影響。一方面業(yè)務(wù)量的增長會導(dǎo)致備份作業(yè)的不斷增加,另外一方面業(yè)務(wù)量的增長會導(dǎo)致現(xiàn)有備份作業(yè)負載的不斷加劇,再有就是各種新業(yè)務(wù)的增加會帶來新型模式數(shù)據(jù)備份的挑戰(zhàn)。這幾方面的因素不但會對現(xiàn)有備份系統(tǒng)的負載擴展能力提出巨大挑戰(zhàn),也會對現(xiàn)有備份系統(tǒng)功能擴展能力提出巨大挑戰(zhàn)。
解決以上問題,本文認為唯一可行的方法就是從單一傳統(tǒng)的備份系統(tǒng)逐漸過渡到完善的備份體系。傳統(tǒng)的備份軟件形成的格局只是這個體系的一個元素,基于快照的備份接口、基于軟件加速的接口、基于異構(gòu)平臺轉(zhuǎn)儲的模塊兒都應(yīng)該成為這個體系當(dāng)中的擴展元素;同時備份介質(zhì)也應(yīng)該從單一的帶庫、DD等傳統(tǒng)備份介質(zhì)擴展到由現(xiàn)有備份介質(zhì)池和分布式存儲池、對象存儲池、云端備份池等多種元素組成的廣義備份介質(zhì)池;單一的備份恢復(fù)模式也應(yīng)該轉(zhuǎn)換為多級數(shù)據(jù)一體化模式,既包括多級數(shù)據(jù)的轉(zhuǎn)儲歸檔機制,又包括數(shù)據(jù)自動化下沉和上浮的機制,數(shù)據(jù)流向?qū)崿F(xiàn)自動化平滑軌跡。
目前可以實現(xiàn)以上體系的軟硬件產(chǎn)品組合有很多,各家都有各家的特點和局限。關(guān)鍵是要靠規(guī)劃者根據(jù)自己的業(yè)務(wù)特點和長遠的發(fā)展預(yù)測來選擇和集成合適的解決方案。
8.總結(jié)和展望
本文基于企業(yè)備份系統(tǒng)建設(shè)過程遇到的一些問題進行深入調(diào)查和剖析,并切合企業(yè)具體問題案例從特定問題角度出發(fā)給出分析思路。隨著目前的分布式技術(shù)、云計算技術(shù)、互聯(lián)網(wǎng)技術(shù)等的不斷發(fā)展,備份體系建設(shè)的內(nèi)容會呈現(xiàn)越來越多的新模式和新思路。
解決的方法也不局限于企業(yè)的數(shù)據(jù)中心內(nèi)部,一些結(jié)合云計算的整體解決方案也在不斷誕生,它會涉及到數(shù)據(jù)的整個生命周期,當(dāng)然這個根據(jù)不同的行業(yè)也會呈現(xiàn)不同的思路和模式。本文將次作為一個基礎(chǔ)性的思考,更重要的是希望能引起更多從業(yè)者從不同角度的思考和提煉,并分享出來供大家參考。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10