存儲(chǔ)比民航飛機(jī)更可靠背后的秘密,是SmartMatrix全互聯(lián)均衡架構(gòu)
架構(gòu)是高端存儲(chǔ)的靈魂所在,市場上主流的高端存儲(chǔ)產(chǎn)品,多年來均未實(shí)現(xiàn)大的突破。那么我們先來看看為什么我們認(rèn)為華為OceanStor存儲(chǔ)Dorado系列高端存儲(chǔ)重新樹立了可靠性新標(biāo)桿。從如下架構(gòu)圖上可以看出,華為的SmartMatrix全互聯(lián)均衡架構(gòu)不僅實(shí)現(xiàn)了控制器的全互聯(lián),而且還實(shí)現(xiàn)了前后端的全共享,為存儲(chǔ)系統(tǒng)的八個(gè)控制器之間相互冗余打下了基礎(chǔ)。使得硬件故障的容忍度極高,帶來了極高的業(yè)務(wù)可靠性。從而實(shí)現(xiàn)當(dāng)出現(xiàn)故障時(shí),上層業(yè)務(wù)“零”感知。
b圖一 SmartMatrix 全互聯(lián)架構(gòu)
對(duì)比與業(yè)界主流的高端存儲(chǔ)架構(gòu),SmartMatrix全互聯(lián)均衡架構(gòu)已從多個(gè)方面實(shí)現(xiàn)了對(duì)市場主流架構(gòu)的突破和超越,使得華為OceanStor存儲(chǔ)Dorado系列高端存儲(chǔ)系統(tǒng)成為業(yè)界唯一實(shí)現(xiàn)控制器容忍8壞7,引擎容忍2壞1,控制器故障,主機(jī)業(yè)務(wù)0感知的高端存儲(chǔ),在可靠性方面樹立了新的標(biāo)桿。
下面我們將介紹華為OceanStor存儲(chǔ)Dorado系列高端存儲(chǔ)系統(tǒng)如何實(shí)現(xiàn)業(yè)界唯一控制器容忍8壞7,引擎容忍2壞1,控制器故障,業(yè)務(wù)0感知的高端存儲(chǔ)。
可靠性標(biāo)桿之一:控制器故障,主機(jī)業(yè)務(wù)0感知
要實(shí)現(xiàn)控制器故障主機(jī)業(yè)務(wù)0感知,關(guān)鍵在于前端接口卡。對(duì)于傳統(tǒng)接口卡,前端業(yè)務(wù)I/O的下發(fā)和分發(fā)需要經(jīng)過控制器預(yù)處理,存在不同控制器間的轉(zhuǎn)發(fā),并且在控制器故障場景需要主機(jī)多路徑進(jìn)行鏈路切換,倒換通常需要5~30秒。而華為OceanStor存儲(chǔ)Dorado系列高端存儲(chǔ)支持前端智能共享卡,智能共享卡對(duì)主機(jī)的I/O進(jìn)行智能識(shí)別處理,并按特定規(guī)則分發(fā),使得主機(jī)I/O無需控制器預(yù)處理就直接發(fā)送給最佳處理控制器,實(shí)現(xiàn)了主機(jī)I/O直通,避免主機(jī)I/O在控制器之間轉(zhuǎn)發(fā)。當(dāng)控制器意外故障時(shí),智能共享卡端口芯片會(huì)感知到與控制器之間的PCIe鏈路斷開,配合控制器內(nèi)的業(yè)務(wù)倒換,智能共享接口卡把主機(jī)的請求重新分發(fā)到其他控制器,實(shí)現(xiàn)了控制器故障秒級(jí)切換,主機(jī)業(yè)務(wù)0感知。
可靠性標(biāo)桿之二,除了可以容忍控制器8壞7,還可以容忍引擎2壞1
傳統(tǒng)高端存儲(chǔ)系統(tǒng),硬盤框不能做到被所有控制器訪問,相當(dāng)于硬盤框?qū)τ?/p>
控制器來說存在歸屬關(guān)系,這樣不僅鏈路上的可靠性不能得到保證,從控制器向硬盤框下發(fā)I/O也始終存在限制,始終存在部分硬盤屬于某些控制器的“私人財(cái)產(chǎn)”,一旦這些控制器出現(xiàn)問題,這些硬盤就無法訪問,整體還是存在可靠性方面的風(fēng)險(xiǎn)。而華為OceanStor存儲(chǔ)Dorado系列高端全閃存采用后端智能共享接口卡實(shí)現(xiàn)硬盤框與8個(gè)控制器全互聯(lián)。
圖二 可靠性標(biāo)桿效果圖
硬盤框?qū)崿F(xiàn)8控全互聯(lián)后,結(jié)合內(nèi)雙活特性,一方面通過緩存3副本技術(shù),即業(yè)界首創(chuàng)的3個(gè)緩存副本分布在3個(gè)不同的控制器,從而保證兩個(gè)控制器同時(shí)故障,或者一個(gè)控制框(引擎)故障情況下,至少還有一份有效的寫緩存副本,實(shí)現(xiàn)2個(gè)引擎任意壞1個(gè)引擎,業(yè)務(wù)0中斷;另一方面還能通過業(yè)界領(lǐng)先的緩存持續(xù)鏡像技術(shù),即一個(gè)控制器失效,鏡像控制器重建緩存鏡像,從而實(shí)現(xiàn)8個(gè)控制器陸續(xù)壞7控,業(yè)務(wù)0中斷。
小結(jié)
華為OceanStor存儲(chǔ)Dorado系列采用的SmartMatrix全互聯(lián)均衡架構(gòu)打造了可靠性的新標(biāo)桿, 引領(lǐng)全閃存發(fā)展的新方向,把存儲(chǔ)系統(tǒng)的可靠性推向一個(gè)新高度。
來源:網(wǎng)絡(luò)