13.1 容災(zāi)方法的具體分析
13.1.1 災(zāi)難備份需求的衡量指標(biāo)
對(duì)于大多數(shù)企業(yè)而言,提到災(zāi)難備份,最直接的反映就是增加預(yù)算,購買更多的主機(jī),存儲(chǔ)設(shè)備以及相應(yīng)軟件。雖然這是實(shí)施災(zāi)難備份項(xiàng)目的一個(gè)必要步驟,但是,從“災(zāi)備方案應(yīng)是風(fēng)險(xiǎn)和成本相應(yīng)平衡”的出發(fā)點(diǎn)來綜合考慮,實(shí)施災(zāi)難備份項(xiàng)目的第一步應(yīng)該從“分析評(píng)估以確定災(zāi)難災(zāi)難備份需求目標(biāo)”開始。
RTO (Recovery Time Objective)
RTO,Recovery Time Objective,是指災(zāi)難發(fā)生后,從I/T 系統(tǒng)當(dāng)機(jī)導(dǎo)致業(yè)務(wù)停頓之刻開始,到IT 系統(tǒng)恢復(fù)至可以支持各部門運(yùn)作,業(yè)務(wù)恢復(fù)運(yùn)營之時(shí),此兩點(diǎn)之間的時(shí)間段稱為RTO。
一般而言,RTO 時(shí)間越短,即意味要求在更短的時(shí)間內(nèi)恢復(fù)至可使用狀態(tài)。雖然從管理的角度而言,RTO 時(shí)間越短越好,但是,這同時(shí)也意味著更多成本的投入,即可能需要購買更快的存儲(chǔ)設(shè)備或高可用性軟件。
對(duì)于不同行業(yè)的企業(yè)來說,其RTO 目標(biāo)一般是不相同的。即使是在同一行業(yè),各企業(yè)因業(yè)務(wù)發(fā)展規(guī)模的不同,其RTO 目標(biāo)也會(huì)不盡相同。
RTO 目標(biāo)的確定可以用下圖來說明:
如上所說,RTO 目標(biāo)越短,成本投入也越大。另一方面,各企業(yè)都有其在該發(fā)展階段的單位時(shí)間贏利指數(shù),該指數(shù)是通過業(yè)務(wù)沖擊分析(BIA-Business Impact Analysis)咨詢服務(wù),以交談、問答和咨詢的方式得到確定的。在確定了企業(yè)的單位時(shí)間贏利指數(shù)后,就可以計(jì)算出業(yè)務(wù)停頓隨時(shí)間而造成的損失大小。如上圖,結(jié)合這兩條曲線關(guān)系,存儲(chǔ)工程師將可以找到對(duì)該企業(yè)而言比較適合的RTO 目標(biāo),即在該目標(biāo)定義下,用于災(zāi)難備份的投入應(yīng)不大與對(duì)應(yīng)的業(yè)務(wù)損失。
RPO (Recovery Point Objective)
RPO,Recovery Point Objective,是指從系統(tǒng)和應(yīng)用數(shù)據(jù)而言,要實(shí)現(xiàn)能夠恢復(fù)至可以
支持各部門業(yè)務(wù)運(yùn)作,系統(tǒng)及生產(chǎn)數(shù)據(jù)應(yīng)恢復(fù)到怎樣的更新程度。這種更新程度可以是上一周的備份數(shù)據(jù),也可以是上一次交易的實(shí)時(shí)數(shù)據(jù)。
圖13-1 RTO 目標(biāo)確定指標(biāo)圖
與RTO 目標(biāo)不同,RPO 目標(biāo)的確定不是依賴于企業(yè)業(yè)務(wù)規(guī)模,而是決定于企業(yè)業(yè)務(wù)的性質(zhì)和業(yè)務(wù)操作依賴于數(shù)據(jù)的程度。因此,RPO 目標(biāo)對(duì)相同行業(yè)的企業(yè)而言會(huì)有些接近,而對(duì)于不同行業(yè)的企業(yè)來說仍可能會(huì)有較大差距。
RPO 目標(biāo)仍是以咨詢的方式,通過與各業(yè)務(wù)部門主管的交流,了解業(yè)務(wù)流程和IT 應(yīng)用的關(guān)系,以及通過回答問卷的方式,確定能夠支持該企業(yè)核心業(yè)務(wù)的RPO 目標(biāo)。
13.1.2 重要系統(tǒng)災(zāi)難備份主要的實(shí)現(xiàn)方法
在目前的技術(shù)條件下,重要系統(tǒng)災(zāi)難備份主要的實(shí)現(xiàn)方法主要有一下幾種:
下面對(duì)各種方式進(jìn)行一個(gè)簡單比較:
表 13-1 容災(zāi)方式比較
13.1.3 災(zāi)難備份方式比較的分析
各種容災(zāi)方式下,只有基于應(yīng)用本身的方式可以做到RTO 為0;其它方式一般需要進(jìn)行網(wǎng)絡(luò)切換、存儲(chǔ)切換和數(shù)據(jù)庫重啟等工作,RTO 一般從幾十分鐘到數(shù)小時(shí)不等;一般都要求主機(jī)和數(shù)據(jù)庫同步,雖然存在理論上的異構(gòu)可能,但是在具體實(shí)施時(shí)會(huì)給開發(fā)/測(cè)試帶來巨大的難度,并大大降低容災(zāi)系統(tǒng)的穩(wěn)定程度,一般不會(huì)采用。
基于應(yīng)用本身的方式雖然可以做到RTO 為0,但是對(duì)應(yīng)用要求極高,并且需要極其復(fù)雜的機(jī)制處理雙中心的數(shù)據(jù)同步問題;目前浙江系統(tǒng)眾多,應(yīng)用復(fù)雜,如果采用這種方案,需要對(duì)所有應(yīng)用進(jìn)行更改,實(shí)施難度極大,顧不予推薦?;诨谖募?數(shù)據(jù)庫日志的方式,只能以文件方式傳輸數(shù)據(jù),數(shù)據(jù)丟失單位至少一個(gè)文件,無法做到RTO=0,在不允許丟失數(shù)據(jù)的關(guān)鍵應(yīng)用上也不適合,顧不予推薦。基于復(fù)制磁盤容災(zāi)主要有同步和異步2種方式,異步方式無法做到RTO=0,在不允許丟失數(shù)據(jù)的關(guān)鍵應(yīng)用上也不適合,顧不予推薦;同步方式的情況下,以復(fù)制主題不同進(jìn)行分類?;谥鳈C(jī)復(fù)制磁盤數(shù)據(jù):磁盤陣列可以異構(gòu)是最大的優(yōu)點(diǎn);但是,這種方式容災(zāi)時(shí)對(duì)主機(jī)性能有一定影響,針對(duì)不同的主機(jī)需要采用不同的實(shí)現(xiàn)方式,目前浙江系統(tǒng)眾多,應(yīng)用復(fù)雜,如果采用這種方案,需要對(duì)所有主機(jī)進(jìn)行論證和實(shí)施,實(shí)施難度較大,顧不予推薦
基于磁盤陣列復(fù)制磁盤數(shù)據(jù):實(shí)施簡單是最大的優(yōu)點(diǎn),不影響主機(jī),只鏡像數(shù)據(jù),是目前較主流的一種容災(zāi)方案;但是,這種方式容災(zāi)時(shí),需要磁盤陣列高度同構(gòu),不但要求磁盤陣列是一個(gè)廠商的,還必須是同一廠商同一系列的陣列,否則無法實(shí)現(xiàn)數(shù)據(jù)復(fù)制,所以,這種方案多用于已經(jīng)進(jìn)行存儲(chǔ)整合的大型系統(tǒng);目前浙江的現(xiàn)實(shí)情況是系統(tǒng)非常多,不同系統(tǒng)采用不同磁盤陣列,很多目前的系統(tǒng)還不支持磁盤陣列的遠(yuǎn)程鏡像功能;如果實(shí)施這種方案,首先需要升級(jí)/替換很多磁盤陣列,然后為每一種陣列在海量存儲(chǔ)系統(tǒng)配置相應(yīng)的同構(gòu)磁盤陣列,投資巨大,每一種不同的陣列采用不同的軟件,維護(hù)不便,而且,中心的各個(gè)存儲(chǔ)各自工作,沒有一個(gè)統(tǒng)一存儲(chǔ)池能夠靈活調(diào)配資源,資源使用也狠浪費(fèi)
基于智能SAN 虛擬存儲(chǔ)設(shè)備復(fù)制磁盤數(shù)據(jù):這種方式擁有所有基于磁盤陣列復(fù)制磁盤數(shù)據(jù)的優(yōu)點(diǎn),而且通過這種方式可以解決許多基于磁盤陣列無法解決的問題:
所以,在目前情況下,基于智能SAN 虛擬存儲(chǔ)設(shè)備進(jìn)行磁盤復(fù)制的方式是最適合目前項(xiàng)目需要的,也是存儲(chǔ)工程師主要推薦的方案。