災(zāi)難補救計劃過程中有幾種常用的標準。 其中最常用的兩種標準是恢復(fù)點目標 (RPO) 和恢復(fù)時間目標 (RTO)。RPO 指的是在發(fā)生災(zāi)難時,恢復(fù)的數(shù)據(jù)未與生產(chǎn)數(shù)據(jù)同步的時間長度。 RTO 指的是恢復(fù)操作所需的時間。其他需要考慮的問題就是,如果只是部分恢復(fù) IT 系統(tǒng),能否在災(zāi)難發(fā)生后恢復(fù)業(yè)務(wù)運營。
  
      問題的補救措施與問題本身一樣五花八門。讓我們看幾個可能用于業(yè)務(wù)連續(xù)性的信息系統(tǒng) (IS) 設(shè)計。
  
      連續(xù)可用性。 在該體系結(jié)構(gòu)中,工作負載平衡加載到多個平臺上(通常分布于不同的地理位置)。 并為每個平臺調(diào)配了備用能力。 一個平臺發(fā)生故障后,就會將它的工作負載分配給剩余的平臺。 這種方法的優(yōu)點在于即使是在發(fā)生災(zāi)難后,公司仍能維持業(yè)務(wù)運營。
  
     在線和近線站點備份。 這種策略假設(shè)故障切換站點可用,它配備了電源、冷卻設(shè)備、網(wǎng)絡(luò)連接、物理安全保護,以及所有其他關(guān)鍵要求。 如果發(fā)生災(zāi)難,故障切換站點有足夠的設(shè)備可用于恢復(fù)業(yè)務(wù)運營。 這種方法的優(yōu)點在于它不像連續(xù)可用性方法一樣需要完整的系統(tǒng)檢查。
  
      備份到磁帶。 最廣為人知的方法,使用一種流行的備份管理軟件包將數(shù)據(jù)備份到磁帶上。 這種方法執(zhí)行的是文件對文件的備份。 然后異地存儲這些磁帶,以備發(fā)生災(zāi)難時進行補救。這種方法最經(jīng)濟,而且在發(fā)生重大災(zāi)難時,還可以使用相同的方法應(yīng)對需要謹慎處理的數(shù)據(jù)問題(即,意外刪除文件)并執(zhí)行恢復(fù)。 但是,這使得業(yè)務(wù)運營的恢復(fù)時間變得很難預(yù)測。
  
      商業(yè)上可行的業(yè)務(wù)連續(xù)性策略在實施業(yè)務(wù)連續(xù)性計劃的成本和潛在停機造成的影響及其可能性之間取得了良好的平衡。 這些更加經(jīng)濟高效的方法允許 IT 專業(yè)人士在更廣泛的應(yīng)用程序支持范圍內(nèi)實施連續(xù)性計劃,實現(xiàn)幾乎不中斷的運營。借助虛擬基礎(chǔ)架構(gòu),中型企業(yè)也具備了實現(xiàn)業(yè)務(wù)連續(xù)性的商業(yè)可行性,而且它的支持范圍大于最關(guān)鍵 IT 應(yīng)用程序中的前 5%。
  
      如何利用虛擬化技術(shù)提高業(yè)務(wù)連續(xù)性
  
      虛擬基礎(chǔ)架構(gòu)在計算、存儲器和網(wǎng)絡(luò)硬件以及在其上運行的軟件之間提供了一個抽象層,簡化了 IT 計算體系結(jié)構(gòu),可以控制成本,并提高響應(yīng)速度。 使用虛擬基礎(chǔ)架構(gòu),應(yīng)用程序和服務(wù)可以調(diào)配到任何 x86 系統(tǒng)上,并在條件發(fā)生變化后可以輕松地在服務(wù)器間轉(zhuǎn)移。 虛擬基礎(chǔ)架構(gòu)將業(yè)界標準服務(wù)器、與它們連接的網(wǎng)絡(luò)和存儲器聚合到統(tǒng)一的資源池中。 這些服務(wù)器封裝為獨立于硬件的虛擬機,這些虛擬機可以使用預(yù)定義的資源分配運行在資源池中的任何主機上。
  
      以目前市場上采用較多的VMware Infrastructure 產(chǎn)品套件為例,是一套提供構(gòu)建虛擬基礎(chǔ)結(jié)構(gòu)所需的服務(wù)器虛擬化和管理軟件。 通過提高效率、靈活性和響應(yīng)能力,可以幫助企業(yè)降低IT 成本??梢詫?shù)據(jù)中心視為一個單獨的處理、存儲和網(wǎng)絡(luò)資源池。它創(chuàng)建了一個統(tǒng)一的硬件映像,該硬件映像使用軟件實施,而且還能運行操作系統(tǒng)和應(yīng)用程序。 在此平臺的頂層,該產(chǎn)品套件提供了對虛擬機的管理和調(diào)配,連續(xù)的工作負載整合,物理服務(wù)器之間的平衡,以及對虛擬機執(zhí)行實時遷移的 VMotion 技術(shù)。 硬件管理完全獨立于軟件管理,硬件設(shè)備可以視為一個單獨的處理、存儲和網(wǎng)絡(luò)資源池,可以將它隨時分配給各個軟件服務(wù),也可以從軟件服務(wù)取消分配。
  
      實現(xiàn)業(yè)務(wù)連續(xù)性的工具多種多樣,但是,由于 Windows 操作系統(tǒng)設(shè)計的特點,即使是最高級的工具也只能在目標物理平臺和源物理平臺完全相同的時候提供完全恢復(fù)。 在故障切換站點保持完全相同的物理平臺,意味必須同步升級主站和故障切換站的硬件,這無疑會大大增加費用,以至無法實現(xiàn)。 恢復(fù)到不同的平臺通常又不可靠,而且還會涉及很多復(fù)雜的人工操作步驟。
  
      為了幫助企業(yè)進行災(zāi)難恢復(fù)計劃,操作系統(tǒng)供應(yīng)商、應(yīng)用程序供應(yīng)商和備份管理軟件供應(yīng)商開發(fā)了專用的 API 和工具,并制訂了最佳實施方案。有些應(yīng)用程序和數(shù)據(jù)具有行為表現(xiàn)明顯不同的模塊,這就要求各個模塊具有不同的災(zāi)難恢復(fù)策略。由于使用了大量的工具,企業(yè) IT 管理員必須學(xué)習(xí)很多新工具,并為災(zāi)難恢復(fù)策略涉及的每個應(yīng)用程序設(shè)計新策略。
  
      固有的連續(xù)可用能力
  
      VMware Infrastructure 提供了多個級別的固有高可用性。 虛擬機的本質(zhì)決定了它們可以跨某臺物理服務(wù)器上的所有虛擬機利用該服務(wù)器的高可用特性。它改變了設(shè)計信息系統(tǒng)的方式,具有在任意虛擬化平臺之間遷移虛擬機、快照、在資源池中的備用主機上自動重新啟動以及 VMotion 等高級功能特性,因而在它創(chuàng)建的環(huán)境中,停機至多不過就是簡單的重新啟動而已。 對于防止應(yīng)用程序或硬件發(fā)生故障的連續(xù)可用性解決方案來說,VMware HA 對運行在虛擬機中的應(yīng)用程序提供了易于使用、經(jīng)濟高效的保護。 如果服務(wù)器發(fā)生故障,受影響的虛擬機將在 VMware Infrastructure 資源池中具有備用能力的其他物理服務(wù)器上自動重新啟動。
  
      當需要不中斷應(yīng)用程序的連續(xù)可用性解決方案時,使用比通常情況下常規(guī)故障切換群集所需的少的多的服務(wù)器,就可以實現(xiàn)駐留在不同物理硬件平臺上的虛擬機間的 N+1 群集。 最后,如果擔心會發(fā)生區(qū)域性災(zāi)難,與 SAN 及數(shù)據(jù)復(fù)制技術(shù)相結(jié)合的虛擬基礎(chǔ)架構(gòu)可提供最高程度的保護。 客戶可在主存儲陣列和故障切換存儲陣列之間使用數(shù)據(jù)復(fù)制,并在整合的故障切換站點上啟動虛擬機。
  
      硬件獨立性
  
      對于業(yè)務(wù)連續(xù)性來說,虛擬化的主要優(yōu)點之一是恢復(fù)過程獨立于恢復(fù)硬件。 由于虛擬機封裝了完整的環(huán)境,包括數(shù)據(jù)、應(yīng)用程序、操作系統(tǒng)、BIOS 和虛擬化硬件,因此可以不考慮底層硬件的差異,而使用虛擬化平臺將應(yīng)用程序恢復(fù)到任何硬件。 而不再受物理世界中必須恢復(fù)到相同平臺的限制。
  
      硬件整合
  
      VMware 的企業(yè)客戶積極利用 VMware 的整合性優(yōu)點,服務(wù)于他們的生產(chǎn)和預(yù)生產(chǎn)服務(wù)器。 對于故障切換硬件來說,整合性還有更多的優(yōu)點。 因為所有工作負載同時發(fā)生故障的可能性極小,而在故障切換設(shè)備中,臨時性地提供較低的應(yīng)用程序性能通常是可以接受的,所以客戶遇到的故障切換設(shè)備的整合率通常會達到主數(shù)據(jù)中心整合率的兩倍。 工作負載的移動性和硬件的高度整合產(chǎn)生的結(jié)果出乎意料,那就是企業(yè)可以在幾乎不影響性能的情況下,讓硬件超額承擔工作負載,進而使自營式災(zāi)難恢復(fù)模式在經(jīng)濟上變得非常有吸引力。
  
      利用虛擬化的業(yè)務(wù)連續(xù)性解決方案



        VMware HA 不間斷地監(jiān)控資源池中的所有服務(wù)器并檢測服務(wù)器故障。放置在每臺服務(wù)器上的代理不斷向資源池中的其他服務(wù)器發(fā)出“心跳信號”,一旦丟失“心跳信號”,將啟動所有受影響的虛擬機在其他服務(wù)器上的重啟過程。
  
      當要求 100% 正常運行時間時,IT 管理員可以在運行關(guān)鍵工作負載的物理計算機和配置相似的虛擬機之間創(chuàng)建一個群集。虛擬機在備用模式中不消耗計算資源,并且可以以極高的整合率整合到一個或幾個物理平臺中。 虛擬機和對應(yīng)的物理設(shè)備一樣,支持相同的群集軟件,包括 Microsoft 群集、Veritas 群集和 Legato AAM,所以不需要 IT 更新。
  
      結(jié)合存儲區(qū)域網(wǎng)絡(luò) (SAN) 部署的虛擬基礎(chǔ)架構(gòu)本身更為穩(wěn)定。 駐留在 SAN 上的任何虛擬機都可以經(jīng)受運行該虛擬機的服務(wù)器的硬件崩潰,并可人工或在 VMware HA 的自動控制下在另一臺 ESX Server 上重新啟動。 然而,最大的優(yōu)點是 VMware VMotion 技術(shù)允許在計劃停機之前將工作負載從某臺物理計算機遷移出,而不會造成用戶停機。
  
      為確保在幾小時內(nèi)完成系統(tǒng)和數(shù)據(jù)恢復(fù),就必須與主數(shù)據(jù)中心設(shè)備同步升級輔助站點上的服務(wù)器硬件。 對于要求更為苛刻的工作負載來說,即使此方法可能也無法實現(xiàn)恢復(fù)時間目標。有了與基于陣列的復(fù)制相結(jié)合的虛擬基礎(chǔ)架構(gòu),企業(yè)就可以將封閉好的虛擬機復(fù)制到輔助站點,并在不需要人為干預(yù)的情況下,在輔助站點以程序化的方法在任何可用的 ESX Server 上啟動該虛擬機。
  
       為了測試數(shù)據(jù)恢復(fù),IT 管理員通常需要為每臺備份計算機找到一臺測試故障切換服務(wù)器,安裝操作系統(tǒng)和備份代理,然后嘗試在測試故障切換服務(wù)器上調(diào)整 Windows 注冊表和其他系統(tǒng)配置。 所有這些問題都可以通過使用虛擬化故障切換硬件來解決。 另外,操作系統(tǒng)安裝、備份代理安裝和 Windows 注冊表調(diào)整只需要進行一次。  
     



      備份是所有災(zāi)難恢復(fù)策略的核心,使用虛擬基礎(chǔ)架構(gòu),IT 管理員可提供比使用物理系統(tǒng)更加靈活的選擇方案。 在這些選擇方案中,第一個是可以繼續(xù)對虛擬硬件使用現(xiàn)有的備份流程。第二個選擇方案是在 ESX Server Management Console 或 VMware Server 主機操作系統(tǒng)中使用備份代理。第三個也是最靈活的備份選擇方案是 VMware Infrastructure 3 所帶的 VMware Consolidated Backup 功能。Consolidated Backup 是一組驅(qū)動程序和腳本,這些驅(qū)動程序和腳本可以使用業(yè)界標準的備份代理,實現(xiàn)對集中式 Microsoft® Windows 2003 代理服務(wù)器上的虛擬機進行無局域網(wǎng)備份。


      虛擬化給業(yè)務(wù)連續(xù)性帶來的好處


      如果已經(jīng)虛擬化輔助數(shù)據(jù)中心,則將立即體驗到以下三點好處:


     需保持相同型號的硬件,因為 IT 管理員可以將封裝在虛擬機中的應(yīng)用程序恢復(fù)至任何 x86 體系結(jié)構(gòu)的硬件,而無需獲取專業(yè)裸機恢復(fù)工具的許可證。


     IT 可以整合數(shù)據(jù)中心的所有硬件,實現(xiàn)規(guī)模經(jīng)濟的好處。


     IT 管理員只需管理獲取和恢復(fù)的單一數(shù)據(jù)類型,即封裝的虛擬機。


      由于輔助數(shù)據(jù)中心不需要具有和主數(shù)據(jù)中心相同型號的硬件,因此也不需要與主數(shù)據(jù)中心同步更新。而主數(shù)據(jù)中心的服務(wù)器平均每三年就需要更換一次,輔助數(shù)據(jù)中心的服務(wù)器可能具有六年的壽命。 對于主數(shù)據(jù)中心逐步淘汰出的服務(wù)器,可以將它們重新部署到輔助數(shù)據(jù)中心以增加能力。


      具有在數(shù)據(jù)中心的不同服務(wù)器間整合硬件資源以及平衡所有關(guān)鍵工作負載的能力后,將提高輔助數(shù)據(jù)中心的整合率,同時對可用性的影響保持最低。服務(wù)器數(shù)量的減少的直接好處就是 TCO 大大降低,其原因是電源和冷卻要求及設(shè)備要求降低、布線和網(wǎng)元減少,還節(jié)約了硬件維護費用。由于減少了硬件更新的需要(硬件壽命更長)、簡化了恢復(fù)測試(測試一次即可恢復(fù)所有虛擬機),并縮短了人員培訓(xùn)的時間(所有應(yīng)用程序都具有統(tǒng)一的流程),因此節(jié)省了更多的 IT 工作。


      中型企業(yè)外包災(zāi)難恢復(fù)設(shè)備的趨勢在過去幾年比較普遍,但是最近有所下降。 這種趨勢發(fā)生轉(zhuǎn)變的原因是主要的承包商傾向于過度擴展他們的資源,造成服務(wù)質(zhì)量下降,以及先來先服務(wù)的策略在區(qū)域性災(zāi)難的情況下會帶來更大的風險。 虛擬化故障切換設(shè)備、整合故障切換服務(wù)器可以減少物理計算機的數(shù)量,這樣企業(yè)就能夠進行內(nèi)營,同時還能夠保持與使用外包模式相同或更好的成本結(jié)構(gòu),并具有控制權(quán),避免風險。

分享到

多易

相關(guān)推薦