更新之后的惠普StoreOnce B6200備份系統(tǒng)規(guī)格(部分)
惠普StoreOnce B6200是此次爭(zhēng)論的焦點(diǎn)之一。筆者曾經(jīng)對(duì)該產(chǎn)品做過比較詳細(xì)的介紹。如今它在新加入的StoreOnce Catalyst(催化劑)軟件配合下滿配8個(gè)節(jié)點(diǎn)的最大重復(fù)數(shù)據(jù)刪除備份速度可達(dá)100TB/小時(shí),不使用StoreOnce Catalyst的情況下也由之前的28TB/小時(shí)提升到40TB/小時(shí)。
需要注意的是,B6200的數(shù)據(jù)恢復(fù)速度為40TB/小時(shí),此時(shí)StoreOnce Catalyst是幫不上忙的。同時(shí)這款產(chǎn)品還加入了對(duì)Symantec OST(Open Storage Technology)的支持。
StoreOnce Catalyst技術(shù)的工作原理和EMC DD Boost比較類似,如下圖:
惠普在新聞稿中表示:“HP StoreOnce Catalyst軟件讓客戶能夠在數(shù)據(jù)傳輸至中央HP StoreOnce備份系統(tǒng)之前,在應(yīng)用服務(wù)器或備份服務(wù)器上刪除重復(fù)數(shù)據(jù)。這種方式提高了靈活性,能夠幫助客戶降低帶寬成本并提高備份吞吐量??蛻艨衫肏P Data Protector 7軟件、Symantec NetBackup或Symantec Backup Exec來管理其HP StoreOnce Catalyst環(huán)境中的重復(fù)數(shù)據(jù)刪除以及數(shù)據(jù)移動(dòng)。獨(dú)立軟件供應(yīng)商(ISV)可通過HP StoreOnce Catalyst開放軟件開發(fā)工具包,從而實(shí)現(xiàn)同樣的控制水平。”
上圖顯示了當(dāng)前可以支持StoreOnce Catalyst API的兩種備份軟件——惠普本次發(fā)布的自家最新版本Data Protector 7和賽門鐵克NetBackup(據(jù)了解Backup Exec即將加入支持)。在左邊的備份服務(wù)器上,HP DP7的介質(zhì)代理中包含了Catalyst API,可以選擇在這里進(jìn)行部分的去重;而右邊則是在NetBackup介質(zhì)服務(wù)器的OST API基礎(chǔ)上,加入了一個(gè)Catalyst插件,同樣可以進(jìn)行預(yù)處理去重。Catalyst指令和數(shù)據(jù)在備份服務(wù)器和B6200系統(tǒng)之間傳輸。
我們可以想象,StoreOnce Catalyst很可能是受到了EMC DD Boost的啟發(fā),因?yàn)镈D Boost一開始只支持賽門鐵克的備份軟件,可以說相當(dāng)于OST的一個(gè)增強(qiáng);后來才移植到被EMC收購(gòu)來的(Legato)Netwoker,以及Avamar源端重復(fù)數(shù)據(jù)刪除解決方案上?;萜赵谕粫r(shí)間準(zhǔn)備好了Catalyst針對(duì)賽門鐵克的插件和Data Protector 7,基本上就是沿著前者的路線走。
EMC DD Boost支持的軟硬件、操作系統(tǒng)和網(wǎng)絡(luò)連接列表
經(jīng)過EMC World 2012上的發(fā)布,我們看到DD Boost又新加入了Quest vRanger虛擬機(jī)備份軟件、Oracle RMAN和Greenplum數(shù)據(jù)庫(kù)的支持。盡管EMC沒有像惠普那樣宣布開放DD Boost的API,但他們也力求兼容更多的軟件。不過筆者認(rèn)為,另外兩家主要的備份軟件——IBM TSM(Tivoli Storage Manager)和CommVault Simpana可能不會(huì)輕易與EMC合作,雖然Data Domain的市場(chǎng)占有率遙遙領(lǐng)先,但別忘了EMC自己還有Netwoker和Avamar正是二者的競(jìng)爭(zhēng)對(duì)手。而且IBM還要推他們的 ProtecTIER虛擬磁帶庫(kù)產(chǎn)品(如今也支持賽門鐵克OST了);CommVault則像很多備份軟件那樣有自己的源端/介質(zhì)服務(wù)器上的重復(fù)數(shù)據(jù)刪除 選項(xiàng)。
上文中已經(jīng)提到過關(guān)于DD Boost和RMAN的集成,其價(jià)值就是在不使用第三方備份軟件的情況下,直接通過RMAN對(duì)Oracle數(shù)據(jù)庫(kù)進(jìn)行備份也能享受到DD Boost預(yù)處理重復(fù)數(shù)據(jù)刪除的好處。
而惠普存儲(chǔ)事業(yè)部的產(chǎn)品營(yíng)銷總監(jiān)Sean Kenney則回應(yīng)道:“RMAN本身不是一個(gè)備份應(yīng)用程序,我們覺得在備份軟件之外備份Oracle沒有多少價(jià)值,這樣不能利用備份應(yīng)用程序的目錄和存儲(chǔ)管理優(yōu)勢(shì)。”
可以說每家公司的說法站在自己角度上都有一定的道理,總之競(jìng)爭(zhēng)帶來了技術(shù)的豐富和進(jìn)步,用戶會(huì)根據(jù)自己的情況來選擇。接下來我們看看幾款產(chǎn)品的橫向?qū)Ρ龋?/p>
五款重復(fù)數(shù)據(jù)刪除系統(tǒng)大比拼
上表來自我們從惠普網(wǎng)站上下載的StoreOnce B6200實(shí)驗(yàn)室驗(yàn)證報(bào)告,因此其中部分規(guī)格僅供參考
首先,我們看到了包括HP B6200、SEPATON(S2100-ES2)、EMC DD990、FaconStor(飛康VTL)和IBM TS7650G VTL網(wǎng)關(guān)在內(nèi)的五款產(chǎn)品。它們都支持虛擬磁帶庫(kù)功能;SEPATON不支持NFS和CIFS標(biāo)準(zhǔn)文件協(xié)議但聽說有這個(gè)計(jì)劃,飛康另有一款FDS文件級(jí)重復(fù)數(shù)據(jù)刪除產(chǎn)品,IBM 7650G則在最近加入了對(duì)CIFS的支持(暫時(shí)還沒有NFS)。在去重卸載方面,惠普和EMC分別憑借StoreOnce Catalyst和DD Boost處于領(lǐng)先,賽門鐵克OST的支持已經(jīng)成為了標(biāo)準(zhǔn)功能。
接下來的最大可用容量(這里是物理容量,而不是可保存重復(fù)數(shù)據(jù)刪除之前的原始數(shù)據(jù)量),最大支持8個(gè)節(jié)點(diǎn)的SEPATON以1.6PB處于領(lǐng)先,而同樣8節(jié)點(diǎn)(4對(duì)高可用)的惠普B6200卻落在了最后。這里列出EMC DD990支持的570TB,在添加Extended Retention軟件選項(xiàng)之后,可以提高到1.3PB(570TB至1.3PB之間為歸檔層)。
在節(jié)點(diǎn)數(shù)量方面,筆者覺得應(yīng)該和性能、高可用性(HA)一同分析。EMC DD990由于是單節(jié)點(diǎn)的系統(tǒng)而不支持Active/Active Failover(故障切換),至于SEPATON、飛康和TS7650G的“FC only”,可能指的是它們通過光纖通道連接后端的存儲(chǔ)陣列,比如SEPATON搭配了HDS(日立數(shù)據(jù)系統(tǒng))的AMS2100,飛康和IBM本身就是軟件或者網(wǎng)關(guān)的形式,自然就不限型號(hào)了。而B6200則是封閉的系統(tǒng),前端的2U服務(wù)器節(jié)點(diǎn)與后端陣列之間通過SAS來連接。
惠普StoreOnce B6200備份邏輯設(shè)計(jì)示意圖(雙節(jié)點(diǎn)HA對(duì))
根據(jù)上圖,每個(gè)VTL/NAS仿真的B6200節(jié)點(diǎn)3.5TB/小時(shí)的讀/寫速度是初始發(fā)布時(shí)的數(shù)值,本次更新后應(yīng)該提升到了5TB/小時(shí),使用StoreOnce Catalyst當(dāng)然就更快了。每個(gè)節(jié)點(diǎn)的64TB可用物理存儲(chǔ),則是通過6Gb/s SAS連接后端的P2000磁盤陣列控制器來實(shí)現(xiàn)的,兩個(gè)B6200節(jié)點(diǎn)同時(shí)也連接到屬于另一個(gè)節(jié)點(diǎn)的P2000陣列,另外節(jié)點(diǎn)間應(yīng)該還有雙10GbE(萬兆以太網(wǎng))通信用于故障偵測(cè)和元數(shù)據(jù)同步。當(dāng)一個(gè)節(jié)點(diǎn)出現(xiàn)問題時(shí),HP Autonomic Restart(自動(dòng)重啟)功能通過將備份重定向至另一節(jié)點(diǎn),無需手動(dòng)干預(yù)即可防止備份失敗。另外,StoreOnce B6200的P2000存儲(chǔ)也是通過雙控制器各自2條SAS鏈路分別連接到前端服務(wù)器。
可以看出,每一款高可用的重復(fù)數(shù)據(jù)刪除系統(tǒng),都是采用盤/控分離的設(shè)計(jì),也就是前端處理去重的服務(wù)器節(jié)點(diǎn),連接外部控制器的后端存儲(chǔ)系統(tǒng),如此才能實(shí)現(xiàn)HA。而EMC Data Domain在硬件上則相當(dāng)一臺(tái)高配置的存儲(chǔ)服務(wù)器,這就是它目前仍不支持高可用的原因。由于DD990的出現(xiàn),在性能和容量上全面被超越從而在產(chǎn)品線中消失的GDA(Global Deduplication Array,全局重復(fù)數(shù)據(jù)刪除陣列),其雙節(jié)點(diǎn)設(shè)計(jì)也是以犧牲可用性為代價(jià)的。
當(dāng)筆者問及EMC怎樣看待用戶對(duì)重復(fù)數(shù)據(jù)刪除產(chǎn)品節(jié)點(diǎn)級(jí)別高可用的需求時(shí),EMC大中華區(qū)副總裁、備份與恢復(fù)系統(tǒng)部總經(jīng)理陳滿恒先生表示:“這個(gè)我們會(huì)向公司總部反映,并且已經(jīng)遇到用戶有這方面的要求。”
再來看性能。在單節(jié)點(diǎn)的比較中,EMC DD990以31TB/小時(shí)遙遙領(lǐng)先;而到了系統(tǒng)最大性能,惠普B6200和SEPATON S2100-ES2都有8倍的提升。值得注意的是,上表列出的數(shù)字沒有達(dá)到惠普宣稱的100TB/小時(shí)(對(duì)應(yīng)單節(jié)點(diǎn)12.5TB/小時(shí))。還有就是 SEPATON的重復(fù)數(shù)據(jù)刪除為后處理(post-processing),而惠普、EMC DD和IBM ProtecTIER都是線內(nèi)(in-line)去重,因此SEPATON最近一次備份的恢復(fù)速度與數(shù)據(jù)初始備份(而不是延后的重復(fù)數(shù)據(jù)刪除處理過程)的 速度同為43.2TB/s?;萜盏恼麄€(gè)系統(tǒng),應(yīng)該看成是由4對(duì)節(jié)點(diǎn)各自單獨(dú)的重復(fù)數(shù)據(jù)刪除索引,四個(gè)單獨(dú)的命名空間組合而成的單一命名空間;而 SEPATON則是跨ES2集群的全局重復(fù)數(shù)據(jù)刪除池。
我們?cè)诖搜a(bǔ)充一點(diǎn),IBM TS7650G ProtecTIER重復(fù)數(shù)據(jù)刪除網(wǎng)關(guān)最近更新后的性能,提高到了9TB/小時(shí),比上表中的雙節(jié)點(diǎn)7.2TB/小時(shí)有所提升。雖然TS7650G的型號(hào)名稱長(zhǎng)期不變,但其硬件是在不斷升級(jí)的,如今使用了四顆10核心的Intel Xeon(至強(qiáng))E7-4860(總共40核)。而其持續(xù)恢復(fù)性能比備份性能還要高(3200MB/s vs. 2500MB/s),達(dá)到了11.4TB/小時(shí)。
Data Domain擴(kuò)展選項(xiàng):備份歸檔一體化?
Data Domain產(chǎn)品線規(guī)格,之前筆者曾經(jīng)列出過這個(gè)表格的英文版本
關(guān)于DD990的性能提升,EMC資深技術(shù)顧問靳揚(yáng)在回答筆者提出的問題時(shí)表示:“簡(jiǎn)單說就是我們的性能提升是依靠Data Domain的算法,這個(gè)叫SISR的算法是收購(gòu)過來的,我們還在發(fā)展,加上結(jié)合CPU的處理能力,通過這兩方面來進(jìn)行提升。我們的提升不是依靠磁盤的性能,而是依靠快速發(fā)展的多核CPU的性能。”
我們還不確定DD990的硬件平臺(tái)采用的是Xeon E5還是E7,但根據(jù)之前的判斷,應(yīng)該是這兩者之一。
從上表中我們還看到,DD990的邏輯容量分為2檔——5.7-28.5PB(對(duì)應(yīng)570TB可用物理容量,分別計(jì)算10-50倍的去重比)和13-65PB(對(duì)應(yīng)1.3PB可用物理容量)。這兩個(gè)可用物理容量點(diǎn)我們?cè)谇拔闹性?jīng)提到過,涉及一個(gè)Extended Retention軟件選項(xiàng)。
注意上圖中的“活動(dòng)層”和“保留層”,它們?cè)谖锢砩鲜窍鄬?duì)獨(dú)立的
ChinaByte比特網(wǎng):我覺得65PB這個(gè)邏輯容量比較大,這兩個(gè)不同的層之間,(重復(fù)數(shù)據(jù)刪除)索引是不是分開做的?
靳揚(yáng):不是,是統(tǒng)一的單一命名空間,你可以理解歸檔層的關(guān)鍵是你可以把它搬走,需要在線就在線,不需要在線就不在線,是一層一層歸檔的。備份這個(gè)層面是570TB,也就是活動(dòng)層的最大容量是570TB,之外到1.3個(gè)PB之間是歸檔層。
以上摘自Data Domain擴(kuò)展盤架規(guī)格表
可以看出DD990默認(rèn)情況下(只有備份層)支持最多30個(gè)ES30擴(kuò)展盤架,而添加Extended Retention軟件選項(xiàng)之后增加到56個(gè)。通過ES30上面的SAS擴(kuò)展器,表明它就是一個(gè)JBOD級(jí)連擴(kuò)展的方式,那么DD990的存儲(chǔ)服務(wù)器硬件上應(yīng)該可以支持不只一塊SAS RAID卡。如果不出意外的話,備份層和歸檔層所包含的擴(kuò)展盤架估計(jì)是連接在不同的RAID卡上面,這樣才適合根據(jù)需要來離線。
同理,數(shù)據(jù)從備份層到歸檔層需要一個(gè)在物理硬盤RAID間移動(dòng)的過程。
如上圖,在數(shù)據(jù)中心和遠(yuǎn)程災(zāi)難恢復(fù)站點(diǎn)的Data Domain系統(tǒng)之間,由于Retention Tier(保留層,也就是歸檔層)中都是不活動(dòng)的“冷數(shù)據(jù)”,因此當(dāng)有一個(gè)保留單元(擴(kuò)展盤架)故障時(shí),用戶不再需要沿著廣域網(wǎng)的復(fù)制路徑反向恢復(fù),而是只要將DR站點(diǎn)中對(duì)應(yīng)的單個(gè)保留單元運(yùn)輸?shù)缴a(chǎn)數(shù)據(jù)中心就可以了。根據(jù)我們的理解,這就是Data Domain離線歸檔的好處之一。