隨著信息化建設的高速發(fā)展,用戶的業(yè)務系統(tǒng)也越來越依賴數(shù)據(jù)中心的服務支持。信息數(shù)據(jù)甚至已經(jīng)成為了企業(yè)發(fā)展的命脈,數(shù)據(jù)安全的重要性也不言而喻。在信息化建設的初期,傳輸網(wǎng)絡和處理能力是我們關(guān)注的重點;而現(xiàn)階段數(shù)據(jù)的安全性已經(jīng)成為了數(shù)據(jù)中心建設的首要考慮因素。
現(xiàn)有的很多技術(shù)手段可以保證數(shù)據(jù)中心內(nèi)的數(shù)據(jù)安全和系統(tǒng)可用性。例如RAID技術(shù)、高可用系統(tǒng)、數(shù)據(jù)備份等等,這些技術(shù)都在數(shù)據(jù)中心范圍內(nèi)保障數(shù)據(jù)安全和系統(tǒng)可用性。但當數(shù)據(jù)中心遭受災難時這些措施就無能為力,所有的應用和數(shù)據(jù)都會遭到損壞,系統(tǒng)將遭受難以估量的損失,對企業(yè)的經(jīng)營活動產(chǎn)生巨大影響,甚至會造成企業(yè)的倒閉,此類案例多不勝數(shù)。這些教訓使人們更加重視整個數(shù)據(jù)中心的安全性和應用可持續(xù)性。容災方案就是用于解決數(shù)據(jù)中心的安全性和高可用性,保證在數(shù)據(jù)中心遭受災難時可以有災備中心繼續(xù)提供數(shù)據(jù)應用服務,使各種業(yè)務應用保持正常運轉(zhuǎn)。
近幾年來,容災已經(jīng)成為信息數(shù)據(jù)中心建設的熱門課題。很多容災技術(shù)也快速發(fā)展起來,對用戶來說也有很廣闊的選擇余地。但由于容災方案的技術(shù)復雜性和多樣性,一般用戶很難搞清其中的優(yōu)劣以確定如何選擇最適合自己狀況的容災解決方案。本文就各種容災方案和如何選擇合適的容災方案做一個初步探討,希望能對數(shù)據(jù)中心容災建設提供一些參考。
容災方案的分類
目前有很多種容災技術(shù),分類也比較復雜。但總體上可以區(qū)分為離線式容災(冷容災)和在線容災(熱容災)兩種類型。
所謂的離線式容災主要依靠備份技術(shù)來實現(xiàn)。其重要步驟是將數(shù)據(jù)通過備份系統(tǒng)備份到磁帶上面,而后將磁帶運送到異地保存管理。這種方式主要由備份軟件來實現(xiàn)備份和磁帶的管理,除去磁帶的運送和存放外,其他步驟可實現(xiàn)自動化管理。整個方案的部署和管理比較簡單,相應得投資也較少但缺點也比較明顯:由于是采用磁帶存放數(shù)據(jù)所以數(shù)據(jù)恢復較慢,而且備份窗口內(nèi)的數(shù)據(jù)都會丟失,實時性比較低。對于資金受限、對數(shù)據(jù)恢復的RTO(目標恢復時間)和RPO(目標恢復點)要求較低的用戶可以選擇這種方式。
在線容災要求生產(chǎn)中心和災備中心同時工作,生產(chǎn)中心和災備中心之間有傳輸鏈路連接。數(shù)據(jù)自生產(chǎn)中心實時復制傳送到災備中心。在此基礎上,可以在應用層進行集群管理,當生產(chǎn)中心遭受災難出現(xiàn)故障時可由災備中心自動接管并繼續(xù)提供服務。應用層的管理一般由專門的軟件來實現(xiàn),可以代替管理員實現(xiàn)自動管理。由上面分析可見實現(xiàn)在線容災的關(guān)鍵是數(shù)據(jù)的復制。數(shù)據(jù)的復制有多種實現(xiàn)方式,也是各有利弊,后面我們深入討論。
由于在線容災可以實現(xiàn)數(shù)據(jù)的實時復制,因此數(shù)據(jù)恢復的RTO和RPO都可以滿足用戶的高要求。因此,數(shù)據(jù)重要性很高的用戶都選擇這種方式,比如金融行業(yè)的用戶。但要實現(xiàn)這種方式的容災必須有很高的投入,一般中小型企業(yè)用戶很難負擔。在方案選擇時一定要結(jié)合多方面的因素考慮。很多的用戶在初期規(guī)劃時都過于追求完美,對RTO和RPO要求過高,并不考慮自身的經(jīng)濟承受能力,導致最后的預算無法負擔。所以選擇容災方案一定要結(jié)合自己的實際情況,并不一定要求無數(shù)據(jù)丟失,只要能確保在業(yè)務的可承受范圍就可以了。
數(shù)據(jù)復制的三層實現(xiàn)方式:
數(shù)據(jù)復制的技術(shù)也有很多,從實現(xiàn)復制功能的設備分布可大體分為三層。分別為服務器層、存儲交換機層和存儲層。(見上圖)
服務器層的數(shù)據(jù)復制
在生產(chǎn)中心和災備中心的服務器上安裝專用的數(shù)據(jù)復制軟件以實現(xiàn)遠程復制功能。兩中心間必須有網(wǎng)絡連接作為數(shù)據(jù)通道??梢栽诜掌鲗釉黾討眠h程切換功能軟件從而構(gòu)成完整的應用級容災方案。這種數(shù)據(jù)復制方式相對投入較少,主要是軟件的采購成本。兼容性較好,可以兼容不同品牌的服務器和存儲設備,較適合硬件組成復雜的用戶。但這種方式要在服務器上運行軟件,不可避免的對服務器性能會有影響,選擇的時候請相對注意。
交換機層的數(shù)據(jù)復制
存儲交換機技術(shù)的發(fā)展使得交換機可以實現(xiàn)更多的功能。很多原來由服務器和存儲實現(xiàn)的功能現(xiàn)在也可在交換機層實現(xiàn),比如存儲虛擬化。同樣,現(xiàn)在有些廠家的交換機產(chǎn)品已經(jīng)可以實現(xiàn)復制功能。在生產(chǎn)中心和災備中心都要部署這種交換機,并在交換機之間通過專用鏈路連接起來。由于交換機可以管理和復制的數(shù)據(jù)是存放在存儲層內(nèi)的。因此,用戶需要將生產(chǎn)數(shù)據(jù)都存儲在交換機所連接的存儲設備中,這樣就可以實現(xiàn)交換機對數(shù)據(jù)的管理和復制。目前使用這種技術(shù)的產(chǎn)品還不是很多,成熟性還有待提高,具有這種功能的交換機價格也相對較高,所以采用這種方案的用戶比較少。
存儲層的數(shù)據(jù)復制
現(xiàn)在的存儲設備經(jīng)過多年的發(fā)展已經(jīng)十分成熟。特別是中高端產(chǎn)品,一般都具有先進的數(shù)據(jù)管理功能。遠程數(shù)據(jù)復制功能幾乎是現(xiàn)有中高端產(chǎn)品的必備功能。要實現(xiàn)數(shù)據(jù)的復制需要在生產(chǎn)中心和災備中心都部署1套這樣的存儲系統(tǒng),數(shù)據(jù)復制功能由存儲系統(tǒng)實現(xiàn)。如果距離比較近(幾十公里之內(nèi))之間的鏈路可由兩中心的存儲交換機通過光纖直接連接,如果距離在200公里內(nèi)也可通過增加DWDM等設備直接進行光纖連接,超過200公里的距離則可增加存儲路由器進行協(xié)議轉(zhuǎn)換途徑WAN或INTERNET實現(xiàn)連接,因此從理論上可實現(xiàn)無限制連接。在存儲層實現(xiàn)數(shù)據(jù)復制功能是很成熟的技術(shù),而且對應用服務器的性能基本沒有影響。在應用層增加遠程集群軟件后就可以實現(xiàn)自動災難切換的整體容災解決方案。目前這種容災方案穩(wěn)定性高、對服務器性能基本無影響,使容災方案的主流選擇。
目前來看容災系統(tǒng)建設的成本投入還是比較可觀的。用戶在選擇容災方案的時候一定要結(jié)合自己應用環(huán)境和預算等實際情況做出決定,適合自己的才是最好的。