日立統(tǒng)一存儲(HUS)100家族規(guī)格表

由上表,日立HUS 110、130和150支持的驅(qū)動器數(shù)量分別為120、264/252(2.5/3.5英寸)和960個,其中HUS 150在上一代中端最高型號AMS 2500的480個驅(qū)動器基礎(chǔ)上增加了一倍,而HUS 110卻比AMS2100的159個有所減少。另外,HUS 100系列除了保持原有的2U 24盤位2.5英寸驅(qū)動器,以及4U 48盤位3.5英寸高密度驅(qū)動器擴展柜(連接由3Gb/s SAS升級到6Gb/s)之外,還符合潮流的地將3U 15盤位3.5英寸擴展柜替換為2U 12盤位(就像戴爾EqualLogic從PS4000/6000升級到PS6100/4100那樣),提高了每個U的密度。

在支持的驅(qū)動器類型中,10k和15k rpm高轉(zhuǎn)速硬盤已經(jīng)全部是SFF(2.5英寸)而不再有LFF(3.5英寸)。根據(jù)HDS網(wǎng)站上更詳細(xì)的資料,這里的SSD有200和400GB MLC(應(yīng)該是企業(yè)級)兩種選擇。

文件訪問通過NAS網(wǎng)關(guān)、對象存儲依賴HCP?

接著,我們看到Block Module和File Module的規(guī)格被分為2個部分。其中塊訪問單元支持的主機接口現(xiàn)在主要是8Gb/s FC和10GbE iSCSI兩種(HUS 110還支持千兆iSCSI),也就是說這款雙控制器模塊化陣列,如果只作為IP SAN使用其定位也不見得比Scale-out(橫向擴展)的EqualLogic、惠普LeftHand等產(chǎn)品低。要知道戴爾EQL目前出貨最多的主流型號還是1Gb/s以太網(wǎng)主機接口的PS6100(之前是PS6000)、4100。

HUS 100系列發(fā)布時并沒有支持16Gb/s FC(光纖通道),不過對于HUS 150來說將來可以通過更換主機I/O模塊來對產(chǎn)品升級,就像AMS2000系列從4Gb/s FC到8Gb/s那樣。HUS 110和130則是每控制器集成4個嵌入式8Gb/s FC接口加上一個主機接口子卡,130可選FC和iSCSI,而110暫時只支持iSCSI。另外比較有意思的是,據(jù)了解HUS 110的光纖通道接口需要可選的license Key才能啟用,也就是說如果不買這個的話應(yīng)該就必須添加iSCSI了。

注:關(guān)于主機接口部分,下文中還會有具體的圖片說明。

日立HUS支持集群高可用的File Module(文件單元)應(yīng)該是三款產(chǎn)品通用的,HUS 110和130只支持雙節(jié)點HA,而150則支持1~4個節(jié)點。這讓我們聯(lián)想起戴爾使用收購自Exanet的集群文件系統(tǒng)推出的EqualLogic FS7500統(tǒng)一存儲,目前也是最多4個節(jié)點,單個文件系統(tǒng)最大512TB,而HUS為256TB。

HUS File Module后端連接Block Module一共使用了4個4Gb/s FC,如果中間沒有光纖交換機直連的話容易造成帶寬浪費。這里的具體原因我們在后面還會討論。不過對比前端提供NAS文件服務(wù)的2個萬兆和6個千兆以太網(wǎng)接口,還是基本夠用的,畢竟以太網(wǎng)的實際效率沒有光纖通道高。

統(tǒng)一“噱頭”背后:日立HUS中端存儲設(shè)計解析

日立統(tǒng)一存儲(HUS)組成單元示意圖

根據(jù)上圖,HUS中端存儲系統(tǒng)的組成部分包括Block Module、File Module、2.5英寸驅(qū)動器機箱和/或2.5英寸驅(qū)動器機箱。塊存儲陣列加上Active/Active NAS網(wǎng)關(guān)的組成形式,與EMC VNX、IBM V7000U和戴爾NX3500/FS7500等沒有本質(zhì)上的不同。根據(jù)各方面的信息(也包括我們在下文中要列出的證據(jù)),日立HUS使用的了被其收購的BlueArc的集群文件系統(tǒng)技術(shù),但我們沒有看到單一全局命名空間功能。

有的讀者應(yīng)該知道,HDS在收購BlueArc之前兩家公司就有緊密的合作。HDS將BlueArc的NAS網(wǎng)關(guān)搭配自己的AMS2000系列SAN陣列銷售,那么今天的HUS統(tǒng)一存儲也是類似的形式吧?

到這里不知大家有沒有注意到,我們在HUS當(dāng)前公布的資料中幾乎沒有看到“對象存儲”功能。HDS官方的新聞稿是這樣表示的:

“Hitachi Unified Storage通過一個獨特的基于對象的文件系統(tǒng)來支持對象數(shù)據(jù),該系統(tǒng)可以智能地為每個文件增加元數(shù)據(jù)并實現(xiàn)自動分層、遷移、對數(shù)據(jù)快照和復(fù)制、在廣域網(wǎng)中更快復(fù)制以及快速數(shù)據(jù)搜索。此外,Hitachi Unified Storage支持Hitachi Content Platform(HCP)利用定制的元數(shù)據(jù)來存儲真實對象并提供法規(guī)遵從功能。與替代系統(tǒng)的方式不同,HCP可以利用在同一個存儲池中的文件和模塊應(yīng)用分享HUS的容量。兩者相結(jié)合,對于客戶來說,這個解決方案比獨立的筒倉對象存儲設(shè)施更加節(jié)省空間和成本。”

按照我的理解,HUS所謂的對象存儲應(yīng)該是利用文件系統(tǒng)(File Module上運行的?)的功能為文件添加元數(shù)據(jù)來實現(xiàn)對象的訪問格式?而對象存儲真正的特點——海量的對象數(shù)目支持和擴展性,看來還是要通過添加HCP(日立內(nèi)容平臺)的元數(shù)據(jù)節(jié)點來解決。

記得筆者在去年9月采訪IBM系統(tǒng)與科技事業(yè)部磁盤存儲CTO Vincent Hsu先生時,他曾經(jīng)表示:“我們現(xiàn)在正在做對象存儲的研發(fā),以后你會看到在我們的SONAS平臺上會有對象存儲的這種技術(shù)出來。”同樣是主要針對非結(jié)構(gòu)化數(shù)據(jù),文件系統(tǒng)與對象存儲設(shè)備的整合或許是未來的一種趨勢?

需要注意的是,IBM GPFS(通用并行文件系統(tǒng))支持declustered(分簇)RAID,應(yīng)該能夠有效解決使用3TB、4TB等大容量硬盤組建傳統(tǒng)RAID 5、6時故障恢復(fù)重建時間長,及由此帶來的性能影響和可靠性問題。而筆者在IDF2012大會報道中提到的AmpliStor采用擦除編碼(或稱糾刪碼)的對象存儲也具備類似特性,同時保證了較好的順序讀寫性能。

AMS2000回顧:對稱式雙控真正的負(fù)載均衡

下面我們先簡單回顧一下AMS2000系列的控制器設(shè)計,為后面對HUS的分析做些預(yù)熱。

統(tǒng)一“噱頭”背后:日立HUS中端存儲設(shè)計解析

HDS AMS系列中端存儲參數(shù)對比

如上表,日立數(shù)據(jù)系統(tǒng)AMS 2100、2300和2500都使用了一顆Intel Xeon CPU用于管理(控制)處理器,其中2500配備了雙核。RAID功能是由具備HDS專利技術(shù)的ASIC來實現(xiàn),AMS 2300、2500和再往前一代的AMS 1000的芯片型號都是DCTL-H,而AMS 2100的DCTL-S應(yīng)該是其精簡版。

統(tǒng)一“噱頭”背后:日立HUS中端存儲設(shè)計解析

HDS AMS 2100雙控制器架構(gòu)圖(左右兩邊分別為控制器0、1)

以AMS 2100為例,DCTL-S RAID處理器在整個控制器中的重要性,就好像惠普3PAR陣列中的Gen3/4 ASIC。它使用三條帶寬為2GB/s的PCIe x8(1.0)分別連接包含Xeon CPU、控制內(nèi)存、MCH+ICH在內(nèi)的管理子系統(tǒng),前端代號為“DE4”的雙端口4Gb/s光纖通道控制芯片,以及后端x8 link 3Gb/s SAS控制芯片。每個控制器中的DCTL-S還連接著2~4GB的數(shù)據(jù)緩存(帶寬4GB/s),同時通過專用通道(應(yīng)該也是PCIe)來實現(xiàn)同步緩存鏡像。

統(tǒng)一“噱頭”背后:日立HUS中端存儲設(shè)計解析

HDS AMS2000動態(tài)負(fù)載均衡技術(shù)示意圖

日立動態(tài)負(fù)載均衡控制器(Hitachi Dynamic Load Balancing Controller)技術(shù),是HDS AMS2000系列產(chǎn)品的一大特色。“幾乎無需用戶干預(yù),即可讓存儲系統(tǒng)發(fā)揮出最大性能。與傳統(tǒng)中端存儲系統(tǒng)采用的非對稱控制器設(shè)計不同,AMS2000可通過監(jiān)視每一個控制器的利用率并動態(tài)平衡工作負(fù)載,消除導(dǎo)致I/O響應(yīng)時間降低的常見瓶頸與熱點。”

根據(jù)筆者有限的了解,NetApp入門級的E2600(收購自LSI Engenio產(chǎn)品線)SAN陣列,可以選購一個Turbo性能選項來獲得將不同LUN手動分配到兩個控制器來實現(xiàn)Active/Active(雙活動) 提高性能的特性。從E2600 OEM而來的IBM DS3500、戴爾PowerVault MD3200/3600系列等都是如此。EMC CLARiiON/VNX家族的ALUA(非對稱邏輯單元存取)設(shè)計,則是在創(chuàng)建LUN時根據(jù)負(fù)載情況分配到一個相對空閑的控制器。在中端雙控制器模塊化 陣列中,幾乎只有AMS2000才是真正能夠?qū)⒚恳粋€LUN的工作負(fù)載平衡分配到兩個控制器上的對稱式處理模式,如上圖。

當(dāng)然,在HP 3PAR、EMC Symmetrix VMAX、IBM XIV,還有被Oracle收購的Pillar Axiom等橫向擴展(Scale-out)存儲系統(tǒng)中,這樣的設(shè)計就比較普遍了。

統(tǒng)一“噱頭”背后:日立HUS中端存儲設(shè)計解析

日立動態(tài)虛擬控制器(Dynamic Virtual Controller)技術(shù)示意圖,這個架構(gòu)看上去不就是AMS 2300嗎?

HDS如今隨同HUS提出的動態(tài)虛擬控制器技術(shù),筆者覺得應(yīng)該就是將原來的“動態(tài)負(fù)載均衡控制器”換個說法,因為其中的示意圖仍然是用AMS2000系列舉例。除了將主機接口控制芯片換成QE8(PMC-Sierra PM8032四通道8Gb/s FC控制器的代號),這里主要是為了表示兩個控制器的本地緩存數(shù)據(jù)之間互相鏡像,從而為同一份數(shù)據(jù)提供“直接”訪問和途經(jīng)另一個控制器的“交叉”訪問。與最基本的Active-Passive等寫緩存鏡像之間的差異,應(yīng)該是對稱式控制器設(shè)計的關(guān)鍵。

增加雙ASIC還是改用x86 RAID處理器?

統(tǒng)一“噱頭”背后:日立HUS中端存儲設(shè)計解析

位于HUS 150 Block Module的電池模塊(從機箱前部插入的一對,互為冗余)

HUS 150塊訪問單元的機箱高度為3U,前部安裝有2個電池模塊,用于在電源失敗事件中將未保存的DRAM緩存中的數(shù)據(jù)備份到閃存。根據(jù)這個電池的尺寸,筆者覺得它應(yīng)該能夠像小容量UPS那樣維持整個控制器供電至少數(shù)分鐘。

HUS 150 Block Module中的控制器(卡)

HUS 150的兩個控制器位于電池模塊的上方,可以連同前端的3個散熱風(fēng)扇一同抽出。在上圖中我們似乎看到主板上2個對等的CPU和Cache內(nèi)存模塊?一種可能性是RAID處理器ASIC增加到了2顆,就像惠普3PAR P10000 V系列控制器中的Gen4 ASIC那樣?另一種可能性就是配置2顆Intel Xeon CPU,而不再區(qū)分RAID處理器和管理處理器?當(dāng)然上圖僅供參考,在沒有看到實物或者更多資料的情況下,一切只是猜測。

HUS 150 Block Module的主機I/O模塊

上圖中2個紅框的位置,就是HUS 150 Block Module控制器可以更換的主機I/O模塊。每個控制器上對應(yīng)的左/右半邊都可以選擇安裝4個8Gb/s FC以及2個10GbE iSCSI接口的任意組合。在它們左邊是2個6Gb/s SAS后端I/O模塊,上面各有2個SFF-8088 miniSAS x4 wide-port連接器用于驅(qū)動器擴展柜。

HUS 130 Block Module后視圖

HUS 130塊訪問單元的機箱高度為2U,控制器(卡)的寬、高尺寸比較接近SBB 2.0規(guī)范設(shè)計,盡管在其機箱前端支持24個2.5英寸或者12個3.5英寸驅(qū)動器,但控制器的深度仍然相當(dāng)長。其后面板的空間有限,每個控制器上前/后端I/O接口的靈活性/數(shù)量不及HUS 150,控制器的性能配置可能也有所下降。但HUS 110和130的硬件設(shè)計應(yīng)該是相當(dāng)接近的。

統(tǒng)一“噱頭”背后:日立HUS中端存儲設(shè)計解析

HUS 130 Block Module的電源及其中嵌入的電池模塊

由于空間的原因,HUS 130電池模塊的位置設(shè)在了電源單元中間空出的部分。這個較小的電池作用同樣是在供電失敗時將未保存的緩存數(shù)據(jù)備份到閃存。

統(tǒng)一“噱頭”背后:日立HUS中端存儲設(shè)計解析

HUS 130 Block Module的6個系統(tǒng)散熱風(fēng)扇采用了不用打開機箱蓋就能從上方置換的設(shè)計,由于位置偏向機箱的右側(cè),不知內(nèi)部還有什么樣的導(dǎo)風(fēng)設(shè)計?

BlueArc:4Gb/s FC受FPGA芯片所限?

統(tǒng)一“噱頭”背后:日立HUS中端存儲設(shè)計解析

HUS File Module的電池模塊(同樣是從機箱前部插入,每臺文件單元上帶有1個)

日立數(shù)據(jù)系統(tǒng)HUS的File Module(即NAS網(wǎng)關(guān))部分,110、130和150三個型號都是通用的。上圖為電池模塊,它插入到機箱的左前方,用于保護(hù)NVRAM中的數(shù)據(jù)。下面有兩個2.5英寸硬盤處于鏡像模式,用于存放File Module的微代碼(microcode,即操作系統(tǒng))。

統(tǒng)一“噱頭”背后:日立HUS中端存儲設(shè)計解析

HUS(日立統(tǒng)一存儲)File Module的主板

根據(jù)上圖及文字描述,HUS文件單元使用了一個定制的帶有24GB內(nèi)存,基于FPGA的主板刀片(MFB);它還使用了一塊安裝了1顆Intel Xeon雙核CPU和8GB內(nèi)存的PC服務(wù)器主板。這里的“FPGA”進(jìn)一步證明HUS統(tǒng)一存儲的File Module使用了收購自BlueArc的集群NAS技術(shù)。

統(tǒng)一“噱頭”背后:日立HUS中端存儲設(shè)計解析

HUS File Module的后部接口:最右邊4個4Gb/s FC端口用于到Block Module塊存儲的SAN訪問

筆者還注意到,F(xiàn)ile Module的后部接口都集中在3U機箱頂部的“1U單元”——應(yīng)該是FPGA所在的主板刀片(MFB)上,下面的“2U”PC服務(wù)器看來還是主要作為管理平臺用途。那么使用4Gb/s而不是今天流行的8Gb/s FC后端接口,有可能就是受BlueArc(現(xiàn)在是HDS下屬的部門了)使用的FPGA芯片所限。

在光纖通道接口的左邊,依次為5個10/100Mb交換式管理接口、6個千兆文件服務(wù)接口、2個萬兆文件服務(wù)接口和2個萬兆集群內(nèi)部互連接口。

HUS統(tǒng)一存儲的NAS網(wǎng)關(guān)使用2個專門的10GbE接口用于集群通信,這就使其一下子顯示出與“非集群”文件系統(tǒng)的不同,也拉開了與戴爾EqualLogic FS7500等千兆統(tǒng)一存儲的差距。當(dāng)然,像EMC Isilon、IBM SONAS那樣的InfiniBand互連網(wǎng)絡(luò)集群效率應(yīng)該會更高。

從日立HUS再看中端存儲趨勢

我們注意到在SAN陣列前端添加NAS網(wǎng)關(guān)仍然是今天主流的統(tǒng)一存儲形式,基本上只有NetApp FAS和Oracle使用Sun ZFS文件系統(tǒng)的7000系列保持“另類”。

再來看看x86,Intel Xeon(至強)處理器能否在中端存儲系統(tǒng)市場一統(tǒng)江湖?根據(jù)筆者的了解,即將推出的新一代Infrotrend ESVA(企業(yè)可擴充式虛擬化架構(gòu))將從PowerPC陣營改投x86,NetApp E7900(對應(yīng)IBM DS5300)的下一代產(chǎn)品如果推出應(yīng)該也是x86… 引發(fā)變革因素的包括擴展性(I/O帶寬上的優(yōu)勢)、靈活性和性價比等。日立HUS的實際情況又是如何呢?

分享到

wangzhen

相關(guān)推薦