圖1
2、業(yè)務(wù)連續(xù)性不強(qiáng)
數(shù)據(jù)的作用是提供給應(yīng)用進(jìn)行處理和展現(xiàn),所以數(shù)據(jù)的好壞將直接決定了應(yīng)用是否正常。對于傳統(tǒng)的全備、增量、差異等備份方式來說,想使用備份數(shù)據(jù)的時候必須經(jīng)歷一個數(shù)據(jù)恢復(fù)的過程。同樣以周日做全備,周一到周六的每天下午6點做增量備份為例。如果當(dāng)前的時間是周六的上午,源數(shù)據(jù)的存儲介質(zhì)損壞,導(dǎo)致源數(shù)據(jù)丟失,此時在修復(fù)存儲介質(zhì)后要首先恢復(fù)上周日的全備份,然后依次恢復(fù)周一到周五的增量,我們且不說周五下午6點到周六上午的數(shù)據(jù)不能被恢復(fù)。就是周一到周五能恢復(fù)的數(shù)據(jù)也要花費大量的時間成本,在此期間應(yīng)用無法獲得正常數(shù)據(jù)的支撐,業(yè)務(wù)將會陷入癱瘓狀態(tài)。
3、不具備防破壞能力。
對于數(shù)據(jù)的破壞,我們在前面分成了自然破壞、軟破壞以及意外破壞。對于自然破壞來說一般采用異地備份的方式,但是對于軟破壞以及意外破壞傳統(tǒng)的備份方式卻很難解決。我們還是以周日做全備,周一到周六的每天下午6點做增量備份為例。假設(shè)當(dāng)前時間是在周五的,上午8點到下午4點期間往數(shù)據(jù)庫中錄入了2萬條索引記錄,而在4點01分,這些數(shù)據(jù)因為一條SQL語句寫錯被誤刪除。那么此時離當(dāng)前時間最近的是周四下午6點的恢復(fù)點,那時候是還沒有這2萬條數(shù)據(jù)的。這就意味著被誤刪的2萬條數(shù)據(jù)將永久丟失。
而對于意外情況,如重啟所造成的數(shù)據(jù)缺失而導(dǎo)致數(shù)據(jù)庫置疑以及無法加載時,也只能恢復(fù)到上一個恢復(fù)點,而這個恢復(fù)點距離故障點有很大的時間窗口,這就導(dǎo)致了破壞無法被完全修復(fù)。
四、核電信息化數(shù)據(jù)可靠災(zāi)備的建設(shè)目標(biāo)
綜合核電領(lǐng)域信息化數(shù)據(jù)的特點,在進(jìn)行容災(zāi)備份時,需要重點實現(xiàn)以下建設(shè)目標(biāo):
1、各服務(wù)器上重要數(shù)據(jù)零丟失
對數(shù)據(jù)進(jìn)行自動監(jiān)控,連續(xù)捕獲和備份數(shù)據(jù)變化,只要數(shù)據(jù)發(fā)生變化,便實時、準(zhǔn)確的備份下來。保證了數(shù)據(jù)的安全,一旦出現(xiàn)數(shù)據(jù)丟失或破壞,可以迅速的從備份機(jī)上把數(shù)據(jù)恢復(fù)回來。
2、災(zāi)難發(fā)生后進(jìn)行迅速接管和逆向同步
當(dāng)主服務(wù)器出現(xiàn)意外宕機(jī)時,備份機(jī)可以在一分鐘之內(nèi)接管主服務(wù)器的IP,提供對外的所有服務(wù),保證了核心業(yè)務(wù)連續(xù)性,可以提供365天7*24小時的業(yè)務(wù)不間斷的保護(hù)。
災(zāi)難發(fā)生后,原有系統(tǒng)必須盡快恢復(fù)。恢復(fù)時執(zhí)行與數(shù)據(jù)容災(zāi)復(fù)制相反的過程,即從災(zāi)備中心逆向同步到主數(shù)據(jù)中心,同步完成即可做應(yīng)用切換,整個系統(tǒng)恢復(fù)到原有狀態(tài)。
3、數(shù)據(jù)可進(jìn)行任意時間數(shù)據(jù)恢復(fù)
可按任意操作步數(shù)或時間點進(jìn)行數(shù)據(jù)快速恢復(fù),回到數(shù)據(jù)庫的任何狀態(tài),從而能夠找回誤刪或者損壞前的數(shù)據(jù)。在恢復(fù)的過程中不但保證了數(shù)據(jù)的完整型,而且能保證事件的完整性。解決了數(shù)據(jù)邏輯錯誤。
4、數(shù)據(jù)的異地容災(zāi)
響應(yīng)《核電文件檔案管理要求》,對重要數(shù)據(jù)進(jìn)行異地容災(zāi),異地的容災(zāi)場地和生產(chǎn)中心需要不在同一個電網(wǎng)、不在同一個江河流域、不在同一個地震帶,相隔300公里以上。
五、核電信息化數(shù)據(jù)可靠災(zāi)備的實現(xiàn)技術(shù)
對應(yīng)第四大點提出的建設(shè)目標(biāo),需要從以下幾點進(jìn)行實現(xiàn):
1、數(shù)據(jù)零丟失
由 于傳統(tǒng)的全備、增量、差異備份方式存在明顯的時間窗口,會導(dǎo)致數(shù)據(jù)的丟失,基于此需要采用一種連續(xù)的保護(hù)模式,即CDP(Continuous Data Protection,持續(xù)數(shù)據(jù)保護(hù))模式。但CDP的產(chǎn)品又分化成兩大類:一種產(chǎn)品仍舊采用定時備份的模式,只是備份的時間窗口變小了,由原來的一天做 一次增量備份變成一小時做一次甚至半小時做一次,人們將這種CDP產(chǎn)品稱為準(zhǔn)CDP(Near CDP);另一種被稱為真CDP(Ture CDP)的產(chǎn)品,可以完全消除備份窗口(在理想的硬件環(huán)境下),RPO(Recovery Point Object 恢復(fù)點目標(biāo))為零,也就是真正意義上的持續(xù)數(shù)據(jù)保護(hù)。核電的數(shù)據(jù)不能丟,就需要采用Ture CDP的備份技術(shù)。
2、業(yè)務(wù)連續(xù)
之 前提到應(yīng)用的是否正常取決于數(shù)據(jù)的是否正常。而對于全備、增量、差異等備份方式來說,數(shù)據(jù)的正常需要一個恢復(fù)的過程,很多情況下,這個過程是過長的。這時 候就需要想辦法來縮短數(shù)據(jù)恢復(fù)的時間,就是縮短RTO(RecoveryTime Object 恢復(fù)時間目標(biāo))??s短RTO的有效方式就是實時恢復(fù),數(shù)據(jù)從主機(jī)備份到備份機(jī)后,隨時進(jìn)行恢復(fù),等待應(yīng)用對數(shù)據(jù)的調(diào)用,是一份最新、完整的Standby 數(shù)據(jù)。而不是出了問題以后再進(jìn)行恢復(fù),那樣必然會導(dǎo)致RTO太長。
3、有效解決軟破壞
很多人把實時備份和 CDP之間畫了等號,這是兩個不一樣的概念。實時備份只是消除了備份窗口,有變化就備份。而據(jù)SNIA(Storage Networking Industry Association 全球網(wǎng)絡(luò)存儲工業(yè)協(xié)會)的CDP特別關(guān)注小組在2011年發(fā)布的一份CDP研究文檔稱:“可以捕獲任意的數(shù)據(jù)變化,至少可以備份到另外一個地方(異地容 災(zāi)),可以恢復(fù)到任意時間點。只有全部滿足以上這三條要求的CDP產(chǎn)品才能稱為真CDP。依據(jù)這樣的標(biāo)準(zhǔn),復(fù)制類技術(shù)(同步以及異步鏡像等。因為鏡像只有 一份數(shù)據(jù),即使有回退點也是有限個點快照)、快照技術(shù)(指針快照以及分割鏡像快照等。因為快照存在時間間隔,兩個快照之間的數(shù)據(jù)可能丟失。且快照頻繁讀取 操作系統(tǒng),在數(shù)據(jù)、文件、應(yīng)用和系統(tǒng)間缺乏嵌入式關(guān)聯(lián)。)以及任何有備份窗口的計劃備份都不屬于CDP產(chǎn)品。”
由此可見,CDP一定能實 現(xiàn)RPO為零的實時備份,但是能實現(xiàn)實時備份的產(chǎn)品未必是CDP,因為所謂的實時備份產(chǎn)品也未必能實現(xiàn)恢復(fù)到任意時間點。而恢復(fù)到任意時間點是解決軟破壞 的唯一辦法。數(shù)據(jù)在什么時候被誤刪除、被篡改,是無法預(yù)知的,不可能實現(xiàn)在刪除、篡改之前做好一個恢復(fù)點。這就需要恢復(fù)點是任意的,這樣才能保證100% 的回到刪除或者篡改之前的狀態(tài)。因為任意點里面必然含有了刪除或者篡改之前的恢復(fù)點。
而對于意外事件來說任意時間點回退也是完美的解決辦法,數(shù)據(jù)出現(xiàn)缺失導(dǎo)致的數(shù)據(jù)庫置疑只需要通過恢復(fù)到最近的一個點就可即保證數(shù)據(jù)可用又保證數(shù)據(jù)最新。
4、無限增量降低災(zāi)備成本
異 地災(zāi)備最重要的資源就是網(wǎng)絡(luò)資源,傳輸帶寬太低達(dá)不到實時備份的效果,傳輸帶寬太高則成本太過昂貴。這就需要在異地災(zāi)備數(shù)據(jù)傳輸?shù)倪^程中采取最優(yōu)的方式, 降低單位時間內(nèi)的數(shù)據(jù)傳輸量。而對于CDP來說是采用的無限增量傳輸模式是將隨時產(chǎn)生的數(shù)據(jù)實時傳輸出去,而不是在某一時間點再進(jìn)行集中傳輸,這樣就大大 降低了對網(wǎng)絡(luò)資源的占用,從而實現(xiàn)了低成本災(zāi)備。
綜上所述,要想實現(xiàn)核電數(shù)據(jù)的可靠性災(zāi)備需要滿足:防止數(shù)據(jù)丟失、防止業(yè)務(wù)停頓、防止數(shù)據(jù)破壞。立足這三點之上選擇合適的災(zāi)備產(chǎn)品,如北京和力記易科技有限公司的UPM備特佳容災(zāi)備份系統(tǒng)。就能將核電的數(shù)據(jù)立于銅墻鐵壁之內(nèi),萬年無失!