話說我們的高端存儲之父,也就是那個以色列的坦克軍官M(fèi)oshe Yanai在2002年,對自己發(fā)明的Symmetrix DMX不滿,但EMC又不讓他去變革這個產(chǎn)品,我估計應(yīng)該是EMC想DMX賣得好好的,是奶牛產(chǎn)品,你把它革了,我靠啥掙錢啊。因此,雙方不歡而散,因此,Yanai回到以色列,找到他的同學(xué),一起創(chuàng)辦了一個XIV公司,打算革掉DMX的命,創(chuàng)造一種全新的高端存儲架構(gòu)。
XIV確實(shí)是一個革命性的產(chǎn)品,主要體現(xiàn)在以下方面:
1、硬件緊耦合—>硬件松耦合。傳統(tǒng)的高端存儲架構(gòu)設(shè)計嚴(yán)謹(jǐn),而XIV采用網(wǎng)格架構(gòu),節(jié)點(diǎn)之間硬件獨(dú)立,只是通過軟件(MPP架構(gòu))來實(shí)現(xiàn)緊耦合的功能。
2、高貴專用的硬件—>普通的通用的硬件。專業(yè)節(jié)點(diǎn)變?yōu)槠胀≒C服務(wù)器,F(xiàn)C盤變?yōu)镾ATA盤,節(jié)點(diǎn)間光纖的連接變?yōu)槠胀ㄒ蕴W(wǎng)的連接。
3、取消RAID。傳統(tǒng)的RAID不用了,直接在系統(tǒng)里面隨機(jī)存放兩份數(shù)據(jù)。
4、COW—>ROW。ROW幾乎可以實(shí)現(xiàn)無限快照。
5、管理復(fù)雜—>0管理。系統(tǒng)不用像傳統(tǒng)的高端一樣去劃分RAID,調(diào)優(yōu),而是拿來你就用,需要多少空間分多少空間,其他的你就不用管了。……應(yīng)該很有很多吧,我總結(jié)主要就是這幾點(diǎn)。
關(guān)于XIV這名字的由來,XIV是羅馬數(shù)字十四的意思。一種說法是指Yanai和他的創(chuàng)業(yè)同學(xué)曾是以色列軍隊精英Talpiot技術(shù)項目的第14屆畢業(yè)生的高材生,因此產(chǎn)品和公司都起名XIV。另外一種說法代表他們對法國國王路易十四的敬仰。我個人更加傾向于第一種說法,因為Yanai前面我們說過,這個人還是比較自戀的,哈哈。據(jù)說國內(nèi)存儲圈某高人幾年前也曾拜訪過此牛人,發(fā)現(xiàn)Yanai的名片上有一行字“The Flag of Storage",存儲的旗幟,何等的意氣風(fēng)發(fā),哈哈。
關(guān)于路易十四這個人,我這里不免八卦一下。路易十四(Louis XIV,外號太陽王)是法國最出名的國王之一,在位的時間很長,經(jīng)歷和我們的康熙大帝類似,恰好他們也是同一個時代的人,據(jù)說還有書信來往。Louis XIV通過文治武功,建立了一個強(qiáng)大的法國。那個時候,歐洲以說法語為榮(我也覺得法語是最好聽的外語,年輕的時候特別崇拜那些能說法語的美女,哈哈),他還建造了著名的凡爾賽宮(10年前去旅游過,確實(shí)宏偉),當(dāng)然,Louis XIV是個矮子(154cm),因此他發(fā)明了高跟鞋(這個發(fā)明我認(rèn)為是對婦女的不尊重,哈哈,穿起來難受死了,我那位我從來就很關(guān)心她,不讓她穿高跟鞋,當(dāng)然,她穿起來比我高一點(diǎn),哈哈)。
不過,最讓我感興趣的是這個統(tǒng)計,路易十四在位72年.實(shí)際執(zhí)政54年,是有準(zhǔn)確歷史以來世界上執(zhí)政時間最長的君主之一。然而,這位君王洗澡卻沒有超過7次。哈哈,估計是法國香水比較厲害,都不用洗澡,不知道這個洗澡次數(shù)是如何統(tǒng)計出來的,真是我們男人的榜樣。
扯遠(yuǎn)了。話說XIV開發(fā)出來后,主要在以色列銷售了40套左右,主要銷售給金融客戶。IBM當(dāng)年被Yanai發(fā)明的Symmetrix把高端存儲份額搶光了,后來雖然搞了一個Shark存儲,但都不能力挽狂瀾,只是搶回了一點(diǎn)份額(參見我前面的文章”IBM高端存儲的前世今生“),因此,IBMer估計對Yanai應(yīng)該是非常的膜拜的,于2007年底決定花3.5億美金收購XIV。從此,IBM開始學(xué)會了左右互搏之術(shù),如周伯通一般,于2009年進(jìn)攻中原,造成中原武林一段腥風(fēng)血雨。
前面西瓜哥把XIV這個十四阿哥的歷史八卦了一下,接下來我們來看看XIV的市場表現(xiàn)情況。
IBM收購XIV后,XIV得到了飛快的發(fā)展,但去年XIV全球出貨臺數(shù)下滑,我也不知道具體原因,大家有知道的告訴我。
我們先來看一下XIV全球的銷售情況。我分析了Gartner全球的XIV銷售數(shù)據(jù),我們一塊來看看我的統(tǒng)計數(shù)據(jù)。從收入的情況看,XIV賣得最好是在2011年,但也不到5億美金。2010年以前增速很快,但2010年以后增長非常平緩,甚至出現(xiàn)倒退。
從臺數(shù)來分析,大家更加能看出問題。2011年銷售超過了2000臺,但2012年急劇下滑,這個到底是什么原因呢?
從容量來看,由于硬盤越來愈便宜,因此,銷售的容量還是一直增長的,不過這個趨勢在我的意料之中。
當(dāng)2009年,IBM把XIV引入中國后,在中國的高端存儲市場掀起了一陣腥風(fēng)血雨。由于XIV太激進(jìn)了,因此,江湖分出兩大派系。
一派以傳統(tǒng)保守勢力為代表,認(rèn)為XIV根本沒有高端存儲的基因,不能算是高端存儲,這個產(chǎn)品必死無疑,不可能得到社會的認(rèn)可(對于高端來說)。
確實(shí),XIV不支持高速硬盤(FS/SAS),采用廉價的機(jī)架服務(wù)器,純粹靠軟件把這些服務(wù)器集成在一起,和大家對高端存儲的理解沒有任何共同點(diǎn)。
但也有另外一派新潮少年,他們一方面是YANAI的粉絲,一方面對傳統(tǒng)的高端存儲已經(jīng)厭惡,感覺沒有任何新意。
突然看到XIV這個玩意,認(rèn)為代表高端存儲的方向,必將具有旺盛的生命力。也是,XIV不需要規(guī)劃,不需要調(diào)優(yōu),不需要管理,拿來就用。一個高端存儲居然做得如家用NAS一樣易用,加上拉風(fēng)的界面,確實(shí)吸引了很多追新一族。
其實(shí)這一切最令人糾結(jié)的就是IBM,IBM的DS8000用戶基本都屬于保守派的,而XIV在營銷材料里面又是列舉出無數(shù)傳統(tǒng)高端存儲的“罪狀”,如功能少,效率低,成本高,管理難等等(現(xiàn)在XIV的紅皮書也是這樣寫的,哈),因此,XIV橫空出世,用來解決這個問題。這可難為了IBM的營銷人員,革命太猛,就打著DS8000,不革命,XIV就沒有活力。
IBM沒有辦法,只能獨(dú)立出一個團(tuán)隊去銷售XIV,因為這兩個團(tuán)隊肯定會打架的,文化理念差異太大。從IBM內(nèi)部的定位上,XIV定位是比DS8000要低一些,是中端到高端的一個補(bǔ)充。
XIV的中國市場表現(xiàn)
廢話少說。我們來看一下歷年XIV在中國的銷售情況。關(guān)于中國區(qū)的銷售數(shù)據(jù),我采用IDC的數(shù)據(jù)來進(jìn)行分析,因為這個數(shù)據(jù)比Gartner的要詳細(xì)。
我們先來看一下出貨臺數(shù)。我們可以看到,從09年進(jìn)入中國以來,XIV出貨快速增長,2012年全球XIV出現(xiàn)下滑,但中國區(qū)還是上漲。但2013年,Q1 的數(shù)據(jù)顯示XIV比2012年同期下滑嚴(yán)重,甚至不如2011Q1??磥鞽IV確實(shí)遇到了增長問題,中國區(qū)只是滯后一下而已。
從行業(yè)來看,XIV在金融、制造、醫(yī)療、電信、交通、公安等政府行業(yè)占比最高。
從區(qū)域來看,北京、廣東、遼寧、浙江、山東等銷量較大。但上海的銷量并不大,看來上海人不是太認(rèn)可XIV。
上次聽一網(wǎng)友反饋,四川公安對XIV很感冒。我查了一些數(shù)據(jù),其實(shí)四川XIV只銷售了5套,只有2套在公安里。因此,應(yīng)該說成績不算特別突出。
而北京我們拆開來看,由于電信和金融集采,因此量最大。其次交通、教育方面也做得不錯。
XIV截止今年Q1,一個銷售了324臺,平均每臺容量只有53TB。不算太高。我們前面統(tǒng)計過,去年高端存儲平均每套容量將近100TB。
IBM XIV,說句心里話,如果不是IBM和Yanai,我是不會把XIV當(dāng)高端存儲的。DS8000由于支持大機(jī),因此雖然是雙控,但列為高端存儲我也認(rèn)了, 因為Gartner一直認(rèn)為,高端存儲必須支持大機(jī)。而XIV,我真的看不出來它為什么是高端。感覺和DELL的Compellent差不多啊。
我們再來看一下XIV的SPC-1測試結(jié)果,沒有超過20萬IOPS,比DS8000差距甚遠(yuǎn),但有一點(diǎn)我比較意外,也就是時延控制在了5ms以下,做得比DS8000要好(DS8000是10ms以下)。
我分析,XIV為什么銷量再下滑, 可能剛開始用戶嘗鮮(確實(shí)XIV有很多賣點(diǎn)),因此銷量一下起來了。但這些老用戶二次購買的欲望再下降,一是XIV的擴(kuò)展性比較差,二是性能確實(shí)一般,三 是只支持SATA盤,這玩意的故障率應(yīng)該比較高(XIV把所有數(shù)據(jù)平均分布到每塊盤上,如果有不同節(jié)點(diǎn)的兩塊盤同時壞了,要丟數(shù)據(jù)的),應(yīng)該也影響到用戶 的體驗。當(dāng)然,這些都是我個人的猜測,如果你有更多的看法,歡迎反饋給我。
因此,2013年,我不看好XIV。但XIV的輝煌,也是值得我們紀(jì)念的。
這真是:
高端存儲江湖險,幾人笑傲;
十四阿哥出身奇,誰與爭鋒。
XIV銷售下滑這個趨勢也是我分析數(shù)據(jù)的時候不小心發(fā)現(xiàn)的,我也很意外。我提出了我的觀點(diǎn),認(rèn)為XIV靠一招鮮贏得了第一波客戶,但由于本身的固有缺陷,因此回頭客不多,這是我的猜測。另外,一個熱心網(wǎng)友分享了他的觀點(diǎn):
這個是有可能的。畢竟DS8000的雙控架構(gòu)天天被EMC/HDS打擊,但XIV的理念確實(shí)和DS8000差距太大,IBM要融合談何容易。
另外一個網(wǎng)友也反饋了一個有用的信息,XIV曾經(jīng)和大機(jī)的LINUX系統(tǒng)對接過。
聯(lián)想到目前網(wǎng)絡(luò)上工信部調(diào)研PRISM門事件和金融行業(yè)討論去IOE(IBM/ORACLE/EMC)化,我就想,最困難是大機(jī)環(huán)境,因為所有的國產(chǎn)存儲都不支持大機(jī)。但是,我們可以變通一下,如讓HW HVS考慮支持大機(jī)的Linux環(huán)境,這樣很多金融和公安購買的大機(jī)可以更換為Linux操作系統(tǒng)繼續(xù)發(fā)揮作用,后面接國產(chǎn)存儲。也許我異想天開了,哈。
感謝兩位熱心網(wǎng)友提供的反饋。
今天我們來簡單看一下IBM XIV的系統(tǒng)架構(gòu)和特點(diǎn)。
XIV是我見過的最簡單的高端存儲了,結(jié)構(gòu)和功能都感覺很簡單。感覺真是大道至簡。
這個一個滿配的XIV,一個機(jī)柜搞定。所有的Module都帶12塊盤。你可以理解為12盤位的機(jī)架服務(wù)器,但只有6個Module可以插接口卡。
至于邏輯圖,也更簡單了。典型的網(wǎng)格MPP計算架構(gòu)。節(jié)點(diǎn)之間通過InfiniBand交換機(jī)互連在一起。理論上應(yīng)該可以支持很多的節(jié)點(diǎn),但I(xiàn)BM XIV目前最多支持15個節(jié)點(diǎn)而已。估計是算法太復(fù)雜了?
大家可以看一下,InfiniBand交換機(jī)的連接方式和以太網(wǎng)交換機(jī)一樣,但和傳統(tǒng)的FC交換機(jī)的組網(wǎng)不同,即交換機(jī)之間有兩條直連線路。(大家想想為什么,不明白可以私信問我)
節(jié)點(diǎn)每3個組成一組,用USB轉(zhuǎn)串口線交叉連接,作為備份的心跳線。這塊我不是特別理解,以前做IBM小機(jī)雙機(jī)的時候,用串口線做備份心跳很正常,為啥把USB也牽涉進(jìn)來?可能結(jié)構(gòu)上更加可靠,做硬件設(shè)計的網(wǎng)友幫忙看看為啥這么設(shè)計?可能由于串口只有一個,無法支持3個節(jié)點(diǎn),但USB口有很多啊,全部用USB也可以???
每個節(jié)點(diǎn)有一塊CF卡,XIV的OS(據(jù)說是基于Linux)就安裝在上面。
IBM最新發(fā)布了新款的節(jié)點(diǎn)類型,CPU、內(nèi)存都得到了提升,而且支持10GE接口卡了。
從每個節(jié)點(diǎn)的后視圖可以看到,每個節(jié)點(diǎn)都支持插SSD卡,但所有的節(jié)點(diǎn)都必須同時插才行。
但是這個SSD沒有做任何冗余,不能用來保存數(shù)據(jù),只是用來做讀Cache使用。XIV發(fā)布了最新的版本XIV Software V11.2,號稱采用SSD后,對數(shù)據(jù)庫的加速提高了4.5倍(上一個版本是3倍),估計是采用了DS8000的一些復(fù)雜的Cache算法,因為 DS8000的Cache的管理是DS8000的最大亮點(diǎn)。
但是讀Cache只針對隨機(jī)I/O,大的I/O和順序I/O就直接讀NL-SAS盤,而不放到SSD中。Cache算法會識別這些I/O而不把熱點(diǎn)數(shù)據(jù)復(fù)制到SSD中。
至于和主機(jī)的連接,由于XIV最多有6個I/O節(jié)點(diǎn),因此每臺主機(jī)可以支持12個路徑到一個LUN,XIV測試性能的時候就這么連接,但最佳實(shí)踐使用IBM建議每個交換機(jī)連接3個I/O節(jié)點(diǎn)就可以了。
至 于支持的硬盤,IBM也?;^,全部文檔的都說是SAS盤,不提SATA和NL-SAS字樣。因此,你標(biāo)書寫要求支持FC/SAS盤,XIV肯定答復(fù)滿 足,哈哈。但你一看容量,你肯定知道這是NL-SAS盤。因此,如果你寫要支持15K轉(zhuǎn)的高速硬盤,XIV只能答不支持了。
至于XIV的RAID 2.0-(前面的帖子我這么稱呼),其實(shí)非常簡單。就是XIV徹底拋棄RAID,所有的硬盤都切成1M大小的塊(XIV叫Partition),然后采用偽隨機(jī)算法,數(shù)據(jù)保存在兩個分區(qū)上。有一點(diǎn)像RAID 10的味道。
IBM的算法,數(shù)據(jù)Partition和它的副本絕對不能位于1個節(jié)點(diǎn)內(nèi),因此,壞了一個節(jié)點(diǎn)(12塊硬盤),數(shù)據(jù)是不會丟失的。IBM的紅皮書說系統(tǒng)最多支持壞1個節(jié)點(diǎn)和另外任意3塊盤(不能同時壞),而整個系統(tǒng)數(shù)據(jù)不丟失。但 在RAID 2.0可靠性分析我也分析過了,XIV的可靠性其實(shí)是比較差的,本身SATA盤的可靠性就不如SAS,而且RAID 10的可靠性不如RAID 6,加上XIV不能控制LUN的分布,LUN都分布在所有的磁盤上,因此,整個系統(tǒng)同時壞兩塊盤(不在一個節(jié)點(diǎn))的概率還是比較大的,因此數(shù)據(jù)丟失的風(fēng)險 很大,江湖上也有XIV丟數(shù)據(jù)的傳聞。
IBM XIV的Thin和Thick LUN的分配粒度都是17GB(準(zhǔn)確來說是16GiB)。17GB是XIV一個神奇的數(shù)字,IBM的紅皮書一直沒有說如何計算出來是17GB的,只是說這是網(wǎng)格架構(gòu)的一個自然屬性,保證每個LUN平均分配到各個節(jié)點(diǎn)中。有誰知道17GB怎么來的網(wǎng)友麻煩告訴一下,我一直沒有想通為什么是這個顆粒度?
好,相信通過我的分析,大家對XIV的架構(gòu)有了一個基本的了解。另外,XIV支持QoS,可以對IOPS和帶寬做限制,不支持?jǐn)?shù)據(jù)完整性標(biāo)準(zhǔn)DIF(據(jù)說現(xiàn)在叫PI了)、磁盤加密、Tier等這些傳統(tǒng)的高端存儲的特性。
至于快照,采用COW方式,前面我們分析過了。遠(yuǎn)程復(fù)制方面,XIV最多支持1對8復(fù)制,而且RPO應(yīng)該比較大,復(fù)制的間隔最少在20s以上。
XIV其實(shí)沒有太多的東西,賣點(diǎn)我前面總結(jié)過了,但我相信還是有些人不接受XIV是一個高端存儲的,但肯定也有人喜歡XIV的。XIV就像榴蓮,喜歡的人愛得不得了,不喜歡的連碰都不碰。因此我把XIV比做高端存儲的榴蓮哥,大家就印象深刻了。
我總結(jié)一下,高端存儲架構(gòu)里面,按照架構(gòu)的保守和激進(jìn)程度,我排一個序:
保守度—DS8000–HDS VSP–EMC VMAX–HW HVS–XIV–激進(jìn)度
IBM處于兩頭,難為IBM的銷售了,必須學(xué)會老頑童周伯通的左右互搏之術(shù),才能把兩個高端存儲賣好。
最后,我看到IBM正在招募XIV新版本紅皮書的作者,好像XIV有新的硬件和軟件特性要發(fā)布,RAS,GUI和鏡像方面好像有增強(qiáng)。等我拿到紅皮書會第一時間給大家解讀。
如果你愛她,請送她XIV,因為那是天堂;
如果你恨她,就送她XIV,因為那是地獄。
最后給大家推薦一款可以管理IBM XIV的手機(jī)軟件吧。
IBM XIV Mobile Dashborad是業(yè)界第一塊高端存儲的手機(jī)管理軟件,只支持iPhone和iPAD。大家有iPhone的可以下載試用一下,有demo模式供你熟悉相應(yīng)的界面
進(jìn)入demo模式后,可以看到5套XIV系統(tǒng)。
每一套demo系統(tǒng),都有一個總儀表盤,可以看到總體的IOPS,帶寬,thin的空間使用情況等等信息。
每一套系統(tǒng),可以看到每個卷的IOPS、帶寬、時延等信息。
同時針對每一個主機(jī),也可以看到帶寬、IOPS、時延等信息。
總體感覺,IBM XIV Mobile Dashborad還是很方便的。管理員在任何地方,都可以通過手機(jī)很方便監(jiān)控存儲的運(yùn)行情況。這種功能一般在中低端可以看到,但高端好像就XIV這么干了,看了XIV還是很潮的嘛。
希望大家積極反饋你的意見和建議,微信掃描如下二維碼,關(guān)注微信公眾號“高端存儲知識”,與作者微信互動。