1999年7月,IBM正式發(fā)布代號為Shark“鯊魚”的企業(yè)存儲服務器(ESS)。當時沒有采用FC技術,而是采用IBM自己研發(fā)的串行存儲結(jié)構(gòu)(Serial Storage Architecture,SSA)。第一代鯊魚是E系列,然后是第二代F系列。

2002年7月15日,IBM推出第三代鯊魚企業(yè)存儲服務器ESS 800。新推出的產(chǎn)品代號“銀鯊”。2004年4月8日,IBM發(fā)布了新一代企業(yè)級存儲服務器ESS 750。ESS 750被稱作“BabyShark”,屬于ESS 800大型機存儲系統(tǒng)的簡化版本。這個時候Shark系列軟件特性也比較豐富了,IBM也拋棄了SSA技術(雖然這個技術也成為了標準),采用了FC技術。

2004年底,IBM推出了第四代鯊魚DS8000系列。同時還推出DS6000小鯊魚侵占中端市場。DS8000經(jīng)過了5代:DS8100、DS8300、DS8700、DS8800,最新的是去年年底推出的DS8870。

我印象中華為HVS在9月份的華為云計算大會推出后,IBM急忙在10月份發(fā)布第五代DS8000產(chǎn)品,DS8870,哈哈。

IBM發(fā)布DS8000后,以DS8000為代表的高端存儲系統(tǒng)市場占有率始終保持中國市場No.1的位置,并持續(xù)高速增長。DS8000系統(tǒng)連續(xù)8年市場份額保持第一。據(jù)IBM統(tǒng)計,截止2011年前,DS8000存儲系統(tǒng)在中國地區(qū)裝機客戶超過1300臺,用戶遍布各行各業(yè),主要客戶包括國有四大銀行、三大運營商等,此外眾多商業(yè)銀行、中小銀行的關鍵業(yè)務應用也都運行在DS8000存儲系統(tǒng)上。

IBM DS8000為啥取得如此輝煌的成績,特別是在中國,主要是中國的信息化不夠發(fā)達,中國人又比較懶,喜歡把服務器和存儲一塊采購,甚至把業(yè)務咨詢都交給IBM,造成中國和海外市場的巨大反差。

但IBM DS8000確實有兩把刷子。我把我對DS8870印象比較深的幾點和大家分享一下。

· 小機雙控架構(gòu),采用最新的P7 CPU和PCIE技術。

IBM DS8000采用了兩臺小型機做雙控的類中端架構(gòu)。DS8870 采用Power7處理器,兩個小機之間的連接也從RIO-G變?yōu)镻CIE。后端的磁盤框連接沒有采用SAS,而是采用FC-AL技術,但IBM沒有采用傳統(tǒng)的仲裁環(huán)技術,而是采用交換式的FC-AL技術(我前面的帖子分析有誤,這里給IBM平個反)。至于雙控的切換時間,前面我也和大家分享過,大約是8-15s。還是不錯的。

至于邏輯圖,大家可以參考這個。DS8870支持一個Base框和3個擴展框。

· 性能第一。IBM去年發(fā)布了SPC-1和SPC-2,性能非常高。SPC-1略微超過了原來的市場第一HP 3PAR V800,拿到了第一的位置。

大家可以看到,時延也控制在了10ms之內(nèi),和3PAR一樣,但性能略超過了3PAR。在高端存儲的SPC-1成績里面,目前還是第一??磥碇荒芗南M贖W HVS去打破這個記錄了。

至于SPC-2的成績,IBM也公布了。

看來也不錯。我們家上網(wǎng)是4Mbps,而DS8870達到15,423MBPS,大家可以想象一下多大的帶寬吞吐量。

· 硬盤全部支持FDE(全盤加密)。不管你要不要這個功能,硬盤都采用FDE硬盤。FDE硬盤每個硬盤都可以采用一個獨立的密鑰進行加密,對系統(tǒng)的性能沒有影響。但FDE硬盤的成本肯定很高,其實很多用戶掏了不該掏的錢。
· 軟件特性豐富。DS8870采用RAID 1.5技術(我前面帖子講過)支持自動分層存儲和自動精簡配置功能。QoS、快照、復制、加密等高端存儲有的功能都有了,甚至對Windows 2012和VAAI都有支持。
· 復雜的CACHE管理算法。IBM的研究人員發(fā)明了很多Cache管理的算法用來提高各種應用場景下的命中率。IBM把Cache按照4K的粒度進行精細化管理,粒度很小。
· 采用DC-UPS直流供電,能效高,獲得能源之星認證;
· 支持IPV6,獲得IPV6 REDAY認證和USGV6認證。

但DS8870我看了一遍,也沒有什么出色的地方,相比原來的DS8800,最大的區(qū)別就是性能提升。DS8870在DS8800發(fā)布2年后發(fā)布的,由于更新不多吧,因此IBM沒有叫它DS8900,可能也是這個原因吧。

說說我對DS8870不滿的地方吧。

· 不支持ISCSI,主機接口只有FC/FICON。客戶的組網(wǎng)不方便,特別是遠程復制,需有購買FC/IP轉(zhuǎn)換設備,增加客戶投資和組網(wǎng)復雜度
· 方案限制太多。DIF只支持大機上的Linux系統(tǒng);很多性能聯(lián)動方案(可以對應用進行感知),只支持AIX+DB2。

總的來說,IBM DS8870是新瓶裝舊酒,沒啥新內(nèi)容。架構(gòu)和軟件特性都沒有什么大變化。

我看完DS8870資料的感覺就是,如果我采用IBM小機+DB2數(shù)據(jù)庫,DS8870是不錯的選擇,因為他們簡直就是一個整體,和一體機感覺差不多。如果采用ORACLE數(shù)據(jù)庫,或者X86平臺,DS8870就沒有太多的亮點了。

根據(jù)IDC的數(shù)據(jù),今天我們來仔細看一下DS8000在2012年到2013年Q1的在中國區(qū)的表現(xiàn)。

一共5個季度,DS8000在中國區(qū)一共銷售了711臺。可以看到,主體出貨是DS8800,但DS8870沒有看到(也可能IDC放在DS8800里面了)。

從端口分布可以看到,大機環(huán)境銷售占了1/3,Open systems還是占大頭,占了2/3的份額。

從行業(yè)的分布看,金融、電信和公安是IBM的產(chǎn)糧地。制造業(yè)、保險、電力、交通、石油和醫(yī)療也有不俗表現(xiàn)。個人感覺,Snowden事件出來后,公安、能源等估計有采購國產(chǎn)設備的趨勢。金融和電信可能會緩慢一些,但前幾天金融圈的一位朋友在微信朋友圈了分享了一條信息,銀監(jiān)會正在討論去IOE方案(IBMORACLEEMC),不知道消息是否屬實。但由于目前沒有任何國產(chǎn)存儲支持大機,因此針對大行困難很大,估計可以學電力D5000項目,做兩套系統(tǒng)并行,一套外商的,一套國產(chǎn)的,當出現(xiàn)問題有替代方案。

在各省勢力分布方面,我們看到北京占據(jù)半壁江山。這個主要是金融和電信的集采政策造成,當然,很多的數(shù)據(jù)中心也在北京。但我們也看到,內(nèi)蒙、河北、東三省和安徽這些不算特別發(fā)達的省份,IBM居然銷售了那么多,甚至超過了很多發(fā)達省份。這個也說明這些省份可能由于專業(yè)人才缺乏,反而傾向采用IBM的整體解決方案,帶動了DS8000的銷售。發(fā)達的省份其實和國外一樣,更加喜歡采用專業(yè)的存儲設備,如EMC、HDS等。

前面的的分析講過,由于IBM DS8000針對自己的產(chǎn)品做了很多定制化的東西,大機環(huán)境就不說了,就是在p系列小機+DB2的環(huán)境下,DS8000有很多針對性的特性:

這些針對應用的聯(lián)動特性,我相信是其他存儲廠商無法支持的。因此,如果用戶選擇了DB2數(shù)據(jù)庫,DS8000確實是一個省事的選擇。幸好,DB2目前份額還不太高。

我們從Gartener的數(shù)據(jù)可以看到,Oracle是數(shù)據(jù)庫市場的老大,占領將近一半的市場份額。而DB2大約占了1/5的市場份額。這個是其他高端存儲廠商的萬幸,如果DB2的市場地位如ORACLE目前這樣,要想和DS8000競爭將更加困難。

傳統(tǒng)的RAID 1.0如果改良后,變身為RAID 1.5來實現(xiàn)Tier和Thin功能。下面就以我理解的DS8870的RAID 1.5切西瓜原理為例,來幫助大家再次理解我的西瓜刀法,哈哈。

首先,DS8870按照一定的原則選擇8塊一樣的磁盤(由于DS8870后端采用FC-AL,因此選擇盤的時候最少要跨兩個環(huán)路才能保證比較好的性能)組織一個Array site。注意,必須是8塊盤。DS8870購買的時候,都是以16塊盤為單位進行購買的,SSD支持以8塊為單位購買。

這8塊盤選擇RAID級別后就組成了一個Array。這些RAID級別只能從下面的幾種6種類型里面選擇:

但是,還有很多的限制。比如SATA盤,只能支持RAID 6,當然,你可以做成RAID 10,但需要向IBM特別申請,RAID 5絕對是不允許的。原因大家都懂的,就是害怕可靠性問題。

大家可以看到,Array是有RAID屬性的。每一個RAID Array組成一個Rank,IBM然后拿出從西瓜哥購買的西瓜刀,切成1GB(嚴格來說,是1GiB)的切片Extent。每個Extent包含數(shù)據(jù)和元數(shù)據(jù)區(qū)域。然后選擇多個Rank組成Extent Pool。

如果你需要做Tier,那么你需要選擇不同類型硬盤的Rank來組成Extent Pool。比如,你需要做3層分層存儲,你需要選擇的Rank必須包含有SSD的Rank,SAS的Rank和NL-SAS的Rank。從上面分析可以看到,DS8870的Tier的粒度是1GB。

最后一步,你從Extent Pool選擇你需要的空間來組成LUN,然后分配給主機使用。這些LUN其實都在整個Pool都條帶化了(striping),因此,不管Pool是否是Tier的Pool,性能都會提高,克服了傳統(tǒng)RAID 1.0只能8塊硬盤同時讀寫的缺陷,一個LUN也可以跨越幾十塊硬盤了。不過這里再次強調(diào),一個RANK數(shù)據(jù)丟失了,整個POOL都完了。

但大家都知道,LINUX和UNIX主機的LVM卷管理軟件也會做Striping,包括IBM自己的SVC也可以做Striping,因此,有可能存儲做了,主機(或者SVC)再做一次Striping。這種現(xiàn)象我們稱為雙重條帶現(xiàn)象。Double Striping可能會造成性能下降,下面這個示意圖就是,兩次條帶,正好相當于不做條帶,性能就會出現(xiàn)問題。大家以后在實施的時候要注意。

如果需要支持Thin LUN,本來IBM應該再從西瓜哥購買的一把小刀,把Extent再切成更小的塊的。但估計是IBM看不起西瓜哥的小刀吧,干脆不切了。直接按照1GB Extent的粒度來做分配(但好像IBM V7000就切成32K粒度,不知道DS8000以后是否要改?)這個谷粒 粒度,我感覺太大了,哈哈,一頓飯吃一幾顆就飽了。這種支持Thin的卷IBM叫ESE(extent space efficient volumes)。

這個1GB的粒度,做Thin的時候雖然有點浪費,但IBM財大氣粗,無所謂,每次多分一點空間,省事。但做快照是,這個粒度成問題了。你想象一下,數(shù)據(jù)庫的I/O典型是8K,一個8K的I/O下來,快照你需要分配1GB的空間,空間浪費好辦,但COW的原來大家都懂,整個1GB的數(shù)據(jù)塊的數(shù)據(jù)你都需要COPY到快照資源池里。這個搬運的數(shù)據(jù)量太大了,對系統(tǒng)的性能影響太大。怎么辦?IBM沒有辦法,只能再找西瓜哥購買一把小刀,把Extent切成64K的Track,這樣的卷叫TSE(track space efficient volumes),專門給快照使用。前面我們講到,TSE不能建立在SATA的RANK上,主要考慮性能問題吧。

好,最后我們再看一下DS8870的邏輯圖,大家按照箭頭再回顧一下IBM的西瓜刀法。

不過,別忘啦,RAID 1.5雖然解決了Tier和Thin的問題,但Extent Pool里面任何一個RAID Array壞了,這個Pool的數(shù)據(jù)都沒有了。這也容易理解IBM讓SATA盤必須用RAID 6的原因了。

好了,希望今天以后,很多人都說,哦,我也清楚什么是RAID 1.5,什么是LUN虛擬化了,我就覺得特別有成就感。

希望大家積極反饋你的意見和建議,微信掃描如下二維碼,關注微信公眾號“高端存儲知識”,與作者微信互動。

分享到

xigua

相關推薦