二。傳統(tǒng)數(shù)據(jù)保護(hù)方法
1。備份
全備份/恢復(fù)
全備份/恢復(fù)用于所有的數(shù)據(jù)類型,是最常見的數(shù)據(jù)保護(hù)方法。該方法對(duì)數(shù)據(jù)進(jìn)行100%復(fù)制,通常是一個(gè)完整的文件或卷,從主磁盤復(fù)制到磁帶或備份磁盤。備份副本是不可執(zhí)行的,并且必須通過(guò)恢復(fù)才可以被應(yīng)用程序進(jìn)行訪問(wèn)。多數(shù)情況下,傳統(tǒng)的備份和從其副本恢復(fù)過(guò)程會(huì)對(duì)應(yīng)用程序又影響甚至需要中斷應(yīng)用程序。
備份或恢復(fù)的對(duì)象越大,應(yīng)用程序及其用戶等待的時(shí)間就越長(zhǎng)。對(duì)于關(guān)鍵業(yè)務(wù)或產(chǎn)生收益的應(yīng)用程序,等待完成備份或恢復(fù)操作的任何時(shí)間都意味著花銷。
文件或卷的全備份和恢復(fù)是數(shù)據(jù)保護(hù)技術(shù)中是最耗時(shí)的,而且可能不易安排。數(shù)年的研究顯示很多備份數(shù)據(jù)與先前備份的數(shù)據(jù)是相同的。備份大量未改變的數(shù)據(jù)產(chǎn)生了大量不必要的重復(fù)冗余數(shù)據(jù),然而作為數(shù)據(jù)保護(hù)策略,全備份和恢復(fù)提供了較高的可信度,因此仍在繼續(xù)被人們使用。
由于備份和恢復(fù)過(guò)程的時(shí)間消耗特性,傳統(tǒng)的備份/恢復(fù)正在轉(zhuǎn)變?yōu)橐恍┭苌募夹g(shù)。在選擇這些選項(xiàng)來(lái)制定有效的備份策略時(shí)需進(jìn)行折衷,并且需進(jìn)行認(rèn)真的審查。
增量備份
增量備份對(duì)最近一次完全備份或增量備份之后發(fā)生變化的數(shù)據(jù)進(jìn)行備份。由于只對(duì)變化的數(shù)據(jù)、文件或塊(根據(jù)具體的實(shí)現(xiàn))進(jìn)行備份,該方法使備份數(shù)據(jù)的數(shù)量最小化,并且縮短了"備份窗口"需要的時(shí)間。然而,由于每個(gè)增量備份通常必須按順序恢復(fù)到它們最近的狀態(tài),其完全恢復(fù)需要耗費(fèi)更多的時(shí)間。這將可能是一個(gè)復(fù)雜的且耗費(fèi)時(shí)間的過(guò)程。通常每周進(jìn)行一次完全備份,每天進(jìn)行一次增量備份。增量備份最小化了備份時(shí)間,但恢復(fù)變得更加復(fù)雜。
差異備份
差異備份前一次差異備份的數(shù)據(jù)以及本次與前一次差異備份間新變化的數(shù)據(jù)進(jìn)行備份。這就是完全備份之間的差異備份的容量每天典型地在逐漸增加的原因。這意味著每天的備份在逐漸增大,因此耗費(fèi)更多時(shí)間,但是恢復(fù)過(guò)程比較容易并且通常比完全備份或增量備份的時(shí)間更短。完全的恢復(fù)只需要最近一次的完全備份和最近一次的差異備份即可完成。差異備份耗費(fèi)的時(shí)間比增量備份長(zhǎng),但它恢復(fù)得更快。
小結(jié):增量備份最小化了備份時(shí)間,而差異備份最小化了恢復(fù)時(shí)間,特定的應(yīng)用可以支持其中的一種或另一種。這些利弊權(quán)衡往往讓存儲(chǔ)管理員感到困惑且耗費(fèi)時(shí)間。大多數(shù)的企業(yè)都想減少讓人痛苦的備份數(shù)量,同時(shí)縮短恢復(fù)的時(shí)間,而非只實(shí)現(xiàn)其中的一項(xiàng)。增量備份和差異備份都是針對(duì)特定應(yīng)用及備份軟件的。多個(gè)應(yīng)用需要多個(gè)實(shí)現(xiàn),從而增加了復(fù)雜性。
2。鏡像
磁盤鏡像
磁盤鏡像用于所有的數(shù)據(jù)類型,使用本地或遠(yuǎn)端磁盤驅(qū)動(dòng)器實(shí)現(xiàn)塊到塊的文件、邏輯單元或物理磁盤卷的復(fù)制。一旦通過(guò)對(duì)原始數(shù)據(jù)元素進(jìn)行復(fù)制而建立了鏡像數(shù)據(jù)元素后,所有其后的寫操作將被存儲(chǔ)到兩個(gè)(或多個(gè))位置,創(chuàng)建相同或幾乎相同的副本。當(dāng)其中的一個(gè)副本出現(xiàn)問(wèn)題時(shí),磁盤鏡像將提供幾乎是即時(shí)的到第二個(gè)副本的訪問(wèn),從而使應(yīng)用可以繼續(xù)而不會(huì)停止。鏡像是高開銷的,它使得需要的磁盤存儲(chǔ)量加倍,顯著增加了初始獲取及正在進(jìn)行的運(yùn)行開銷。同時(shí),存儲(chǔ)管理員必須選擇實(shí)行異步或同步鏡像,需對(duì)每種情況進(jìn)行利弊權(quán)衡。同步鏡像經(jīng)常應(yīng)用在主機(jī)及其它應(yīng)用具有關(guān)鍵性特征的高可用環(huán)境中。同步鏡像中,源設(shè)備及目標(biāo)設(shè)備必須在確認(rèn)寫操作已經(jīng)完成后,才能進(jìn)行下一次寫操作。這會(huì)降低應(yīng)用的性能,但使得鏡像元素與真實(shí)的(準(zhǔn)確的)數(shù)據(jù)元素相互同步。
異步鏡像
對(duì)于異步鏡像,源設(shè)備和目標(biāo)設(shè)備不必同步它們的寫操作,從而允許第二個(gè)以及后面的寫操作獨(dú)立進(jìn)行。因此異步鏡像比同步鏡像更快,但是其第二副本會(huì)和原本有輕微的失步。異步鏡像有時(shí)應(yīng)用于廣域的備份市場(chǎng)以將數(shù)據(jù)復(fù)制到數(shù)百里以外的地方。由于數(shù)據(jù)量龐大,而高速帶寬又價(jià)格不菲,這將造成非常高的開銷。實(shí)際中,備份的數(shù)據(jù)相對(duì)原數(shù)據(jù)的滯后或失步很少會(huì)超過(guò)一分鐘。但對(duì)于特定的關(guān)鍵任務(wù)的或?qū)懖僮黝l繁的應(yīng)用來(lái)說(shuō),備份數(shù)據(jù)的滯后或失步將會(huì)帶來(lái)極大的風(fēng)險(xiǎn)。
小結(jié):鏡像應(yīng)用于許多關(guān)鍵任務(wù)的應(yīng)用中,由于其通過(guò)自動(dòng)轉(zhuǎn)換到鏡像副本的恢復(fù)操作在幾秒或者更短的時(shí)間內(nèi)即可完成,因此它是硬件子系統(tǒng)或設(shè)備故障時(shí)進(jìn)行數(shù)據(jù)訪問(wèn)的最快方法。 注意鏡像并不能幫助保護(hù)對(duì)數(shù)據(jù)的損壞,如黑客、蠕蟲、病毒、入侵、人為或軟件錯(cuò)誤,而只是生成了兩個(gè)或多個(gè)侵蝕了的副本。為了最好的效果,鏡像通常應(yīng)和其它能夠恢復(fù)到數(shù)據(jù)受損之前的干凈數(shù)據(jù)的保護(hù)方案一起使用。磁盤鏡像被定義或通常被稱為RAID 1。
三。數(shù)據(jù)保護(hù)新方法
由于傳統(tǒng)的數(shù)據(jù)保護(hù)方法存在折衷及局限問(wèn)題,其它的一些技術(shù)正在日益發(fā)展以減少傳統(tǒng)方法中的一些局限。
1??煺?/strong>
快照副本給出變化數(shù)據(jù)的一個(gè)一致的時(shí)間點(diǎn)視圖。眾多的數(shù)據(jù)存儲(chǔ)提供商提供各種各樣的快照實(shí)現(xiàn),但并非所有快照的建立都是相同的。當(dāng)使用快照副本的同時(shí)有寫操作發(fā)生時(shí),發(fā)生變化的區(qū)域(寫)被保存到磁盤的一個(gè)單獨(dú)的專門為快照活動(dòng)所保留的存儲(chǔ)區(qū)域或分區(qū)中。這里影響到的區(qū)域或塊的舊值可以被保存以防新的塊被破壞,或者允許建立虛擬數(shù)據(jù)映像,用于不停機(jī)備份。存儲(chǔ)管理員需管理快照的數(shù)量及類型。
小結(jié):照提供了對(duì)入侵和數(shù)據(jù)破壞的保護(hù),但沒有對(duì)源數(shù)據(jù)設(shè)備的故障進(jìn)行保護(hù)。這里也存在折衷??煺崭北久媾R的挑戰(zhàn)是不易找到正好在數(shù)據(jù)破壞發(fā)生前的那個(gè)快照副本,同時(shí)當(dāng)快照的數(shù)量增加時(shí)復(fù)雜性也在增加。基于多個(gè)應(yīng)用及軟件的實(shí)現(xiàn)會(huì)使應(yīng)用快照的復(fù)雜性增加。
2。CDP
CDP(Continuous Data Protection持續(xù)數(shù)據(jù)保護(hù)) 是使得每個(gè)寫或更新操作被持續(xù)地寫入磁盤設(shè)備,該磁盤設(shè)備可能和主設(shè)備相同或不同,在需要的時(shí)候能夠恢復(fù)數(shù)據(jù)。如果說(shuō)快照副本是一系列靜態(tài)的圖像,那么CDP就如同是一部電影。然而與鏡像不同,CDP的第二副本是帶有時(shí)間戳的寫事件的連續(xù)歷史。所有的寫操作在從盤或日志設(shè)備中進(jìn)行排隊(duì)。典型地日志記錄2~4天的連續(xù)歷史,覆蓋數(shù)據(jù)恢復(fù)最大可能發(fā)生的周期。日記對(duì)保護(hù)入侵及數(shù)據(jù)侵蝕尤其有益,它可以完成到發(fā)生數(shù)據(jù)損壞之前時(shí)間點(diǎn)的恢復(fù)。稀疏日志用于記錄更加重要的任務(wù)的寫操作。這里存在著利弊權(quán)衡。
小結(jié):CDP和快照副本面臨同樣的挑戰(zhàn),它們不能替代傳統(tǒng)的備份或者在數(shù)據(jù)中心發(fā)生丟失時(shí)提供保護(hù)。CDP非常適合對(duì)數(shù)據(jù)變化量小的環(huán)境中的數(shù)據(jù)損壞進(jìn)行恢復(fù)?;诙鄠€(gè)應(yīng)用及軟件的實(shí)現(xiàn)會(huì)使應(yīng)用CDP的復(fù)雜性增加,許多應(yīng)用不支持CDP。
3。VTL
VTL(虛擬磁帶庫(kù)Virtual Tape Library)解決方案的數(shù)量在不斷增加,目前備份/恢復(fù)市場(chǎng)中有超過(guò)25家公司在提供各種各樣的虛擬磁帶的應(yīng)用。主機(jī)虛擬磁帶的概念最先出現(xiàn)在1997年,并通過(guò)IBM和StorageTek開始普及,因?yàn)榇艓Ш械挠行Ю眠M(jìn)入了歷史上的低谷。虛擬磁帶的應(yīng)用帶來(lái)的益處有目共睹,VTL現(xiàn)在可在非主機(jī)系統(tǒng)中用作快速磁盤緩存。
虛擬磁帶庫(kù)由一個(gè)磁盤組構(gòu)成,看上去像屬于磁帶庫(kù)的若干磁帶機(jī),但并不包含實(shí)際的物理磁帶庫(kù)。VTL通常有兩種類型:集成的和獨(dú)立的。集成的虛擬磁帶庫(kù)將磁盤陣列作為前端與自動(dòng)磁帶庫(kù)相結(jié)合,而獨(dú)立的虛擬磁帶庫(kù)不直接控制物理磁帶庫(kù)。磁盤存儲(chǔ)在大容量且低開銷的磁帶庫(kù)中用作高速緩存或緩沖器存儲(chǔ)處理比較活躍的數(shù)據(jù)。在操作系統(tǒng)看來(lái)如同多個(gè)磁帶機(jī)而非物理磁盤驅(qū)動(dòng)器,從而把磁盤"虛擬"為自身以外的其它設(shè)備。
虛擬磁帶系統(tǒng)在一個(gè)物理磁帶盒中儲(chǔ)存多個(gè)虛擬磁帶卷,通??墒勾艓Ш械睦寐蔬_(dá)到80%或更高。隨著磁帶盒容量的快速增加,提高其利用率將變得更加重要。預(yù)定的策略,如文件大小、使用容量及使用頻率決定了何時(shí)將數(shù)據(jù)直接移入或移出磁盤緩沖及磁帶庫(kù)。這種情況下,類似HSM(分級(jí)存儲(chǔ)管理Hierarchical Storage Management)基于策略的功能存在于應(yīng)用服務(wù)器之外,直接控制磁盤和磁帶存儲(chǔ)器間雙向的數(shù)據(jù)移動(dòng),從而使得第2級(jí)和第3級(jí)的存儲(chǔ)間能直接進(jìn)行數(shù)據(jù)傳輸。
小結(jié):虛擬磁帶的益處,如高性能(可以頻繁的從磁盤高速緩存中進(jìn)行數(shù)據(jù)訪問(wèn)),顯著地增加了磁帶盒的利用率,通過(guò)定義多個(gè)磁帶動(dòng)器而非增加物理的并行I/O活動(dòng),簡(jiǎn)化了備份策略的管理,并且通過(guò)減少磁帶驅(qū)動(dòng)器及介質(zhì)的數(shù)量獲得經(jīng)濟(jì)效益。這里同樣存在著利弊權(quán)衡,因?yàn)橛泻芏喾N技術(shù)可供選擇,確定適合本企業(yè)選擇最佳VTL需要花費(fèi)很多時(shí)間。