雞蛋要不要放在一個籃子里?
信息化發(fā)展到今天,數(shù)據(jù)的大集中、數(shù)據(jù)價值的實現(xiàn)已經(jīng)是信息化系統(tǒng)的主要作用之一。在數(shù)據(jù)大集中的基礎(chǔ)上,我們?nèi)粘5纳a(chǎn)生活也越來越依賴信息系統(tǒng)上承載的豐富多樣的應(yīng)用。用一個形象的比喻,我們把越來越多的關(guān)鍵數(shù)據(jù)、關(guān)鍵應(yīng)用放在了一個籃子里。在這種情況下,以前往往被人們忽視的一個重要問題??如何保證數(shù)據(jù)、業(yè)務(wù)在重大災(zāi)難過程中的平安,進而讓已經(jīng)嚴重依賴它們的企業(yè)、機構(gòu)順利渡過難關(guān),在最短的時間內(nèi)恢復(fù)正常運轉(zhuǎn)??很明確地擺在人們面前。
這樣我們面臨著一個矛盾:信息化的不斷深入,需要將眾多關(guān)鍵數(shù)據(jù)集中管理,通過數(shù)據(jù)的整合和其價值的進一步開發(fā),實現(xiàn)對業(yè)務(wù)的支撐乃至提升。另一方面,在數(shù)據(jù)大規(guī)模集中特別是關(guān)鍵數(shù)據(jù)大集中的過程中,保障信息、保障整體業(yè)務(wù)的安全的迫切性也日益突出。有權(quán)威機構(gòu)預(yù)測,在嚴重的災(zāi)難之中,將有60%以上的企業(yè)因其信息系統(tǒng)被破壞、關(guān)鍵數(shù)據(jù)丟失導(dǎo)致的業(yè)務(wù)癱瘓而倒閉。在這種情況下,我們往往需要把雞蛋放在多個籃子里。從這一角度說,容災(zāi)目前備受矚目也就不足為奇。特別是以往不會考慮容災(zāi)的廣大中小企業(yè)和機構(gòu),也紛紛尋求實施容災(zāi)的可能性,而電信、金融以及其他國家要害部門,更把容災(zāi)作為信息系統(tǒng)進一步完善過程中的核心工作之一。
容災(zāi) 并不艱深
不過對于中小企業(yè)和機構(gòu)而言,最大的顧慮在于以往容災(zāi)高高在上的“地位”。以往容災(zāi)大多在高端計算領(lǐng)域出現(xiàn),應(yīng)用范圍也僅僅局限在超大型跨國企業(yè)和金融、電信的要害部門。容災(zāi)方案往往也為高實施成本、高維護成本畫上等號。但是實際上,這樣的理解并不全面。
說到容災(zāi)方案和技術(shù),總體上可以區(qū)分為離線式容災(zāi)(冷容災(zāi))和在線容災(zāi)(熱容災(zāi))兩種類型。
所謂離線式容災(zāi)主要依靠備份技術(shù)來實現(xiàn)。其主要步驟是將數(shù)據(jù)通過備份系統(tǒng)備份到磁帶上面,而后將磁帶運送到異地保存管理。這種方式主要由備份軟件來實現(xiàn)備份和磁帶的管理,除去磁帶的運送和存放外,其他步驟可實現(xiàn)自動化管理。
離線式容災(zāi)方案的部署和管理比較簡單,相應(yīng)投資也較少。但缺點也比較明顯:由于是采用磁帶存放數(shù)據(jù),所以數(shù)據(jù)恢復(fù)較慢,而且因這種備份并非達到頻繁備份,未來得及備份的數(shù)據(jù)都會丟失,實時性比較低。
在線容災(zāi)要求生產(chǎn)中心和災(zāi)備中心同時工作,生產(chǎn)中心和災(zāi)備中心之間有傳輸鏈路連接。數(shù)據(jù)自生產(chǎn)中心實時復(fù)制傳送到災(zāi)備中心。在此基礎(chǔ)上,可以在應(yīng)用層進行集群管理,當生產(chǎn)中心遭受災(zāi)難出現(xiàn)故障時可由災(zāi)備中心自動接管并繼續(xù)提供服務(wù)。應(yīng)用層的管理一般由專門的軟件來實現(xiàn),可以代替管理員實現(xiàn)自動管理。
從上面的介紹中我們可以看到,容災(zāi)的核心之一,是數(shù)據(jù)的復(fù)制和備份。然而在這里需要說明的是,容災(zāi)與備份所實現(xiàn)的作用或者說保障的層面是不同的。數(shù)據(jù)備份實際上實現(xiàn)的是數(shù)據(jù)的保護與恢復(fù);容災(zāi)則在保護數(shù)據(jù)的基礎(chǔ)上,實現(xiàn)對應(yīng)用、對業(yè)務(wù)乃至對整個企業(yè)正常運轉(zhuǎn)的保護。
容災(zāi)方案的規(guī)劃與實施:從需求出發(fā)
既然容災(zāi)體系對于我們的業(yè)務(wù)、企業(yè)日益重要,容災(zāi)又是一個涉及包括業(yè)務(wù)在內(nèi)多方面內(nèi)容的一個問題,那么對于更廣范圍內(nèi)的各個信息化應(yīng)用的單位而言,如何決定是否實施容災(zāi)方案,決定究竟采用哪種容災(zāi)方案?
從目前業(yè)內(nèi)的一般情況而言,容災(zāi)方案的確定一般需要經(jīng)過7個步驟,包括災(zāi)難類型分析、業(yè)務(wù)沖擊分析、當前業(yè)務(wù)環(huán)境及恢復(fù)能力分析、容災(zāi)策略制訂、容災(zāi)方案設(shè)計、業(yè)務(wù)連續(xù)性流程設(shè)計、業(yè)務(wù)連續(xù)性流程及容災(zāi)方案管理和測試。
這一過程看似非常龐雜繁瑣,實際上并不復(fù)雜。在籌備容災(zāi)項目的時候,首先需要評估、判斷目前數(shù)據(jù)、應(yīng)用、數(shù)據(jù)對連續(xù)性、可用性的要求是否需要對容災(zāi)進行投資。接下來是需要根據(jù)業(yè)務(wù)運作的實際情況、可能遇到的災(zāi)難以及在災(zāi)難發(fā)生之后對業(yè)務(wù)的影響程度進行深入分析,并且根據(jù)目前的應(yīng)用架構(gòu)對災(zāi)難的承受能力,確定采用的容災(zāi)等級和容災(zāi)的方向。接下來就可以對容災(zāi)體系進行規(guī)劃和實施了。當然這其中還包括與容災(zāi)相關(guān)的制度、流程、業(yè)務(wù)的梳理和整合。
具體而言,對于中小企業(yè)等對于RPO、RTO容忍程度較高、關(guān)鍵數(shù)據(jù)較少、對IT系統(tǒng)依賴相對較低的場合,可以采用低成本、高RPO、RTO的離線數(shù)據(jù)備份方式以及本地備份方案,備份介質(zhì)選擇通??梢圆捎么艓А6鴮τ陉P(guān)鍵數(shù)據(jù)量龐大、關(guān)鍵業(yè)務(wù)運行完全依賴于IT系統(tǒng)但是對RPO、RTO有一定的容忍度的場合,可以在本地高可用體系下,采取存儲方案高低搭配、離線備份與在線備份結(jié)合的方式實現(xiàn)容災(zāi)。例如可以采用浪潮AS500存儲系統(tǒng)、SAN架構(gòu)作為主存儲系統(tǒng),浪潮AS330G2存儲系統(tǒng)、iSCSI技術(shù)作為備份存儲系統(tǒng),同時配以磁帶實施異地備份的方式來實現(xiàn)容災(zāi)。
當然對于要求零數(shù)據(jù)丟失、零災(zāi)難恢復(fù)時間,對用戶實現(xiàn)透明切換的關(guān)鍵部門、關(guān)鍵領(lǐng)域,就需要完備的災(zāi)難備份體系和遠程災(zāi)難備份中心。主系統(tǒng)與遠程災(zāi)難備份中心往往實施相同的計算架構(gòu),在存儲解決方案上,采用同步復(fù)制的高級數(shù)據(jù)管理,在這種環(huán)境之下,更多的會采用高成本的全光纖架構(gòu)和遠程光纖傳輸方案,保證業(yè)務(wù)的連續(xù)性和高可用性。
總而言之,從目前的情況來看容災(zāi)的實施既是逐漸迫在眉睫的事情,同時又是需要深入思考和規(guī)劃的事情。在容災(zāi)的實施方案選擇的過程中,則有多種方案以適應(yīng)各種不同層次、不同目標的容災(zāi)需求。選擇容災(zāi)方案的出發(fā)點,根本還是依據(jù)實際情況而行。