張?zhí)?lè)先生介紹說(shuō),面對(duì)PCle的問(wèn)題,首先,我們要考慮NVMe SSD雙端口,這樣做的好處是,即便在單個(gè)鏈路出現(xiàn)掉電,斷路等情況,或單個(gè)主控出現(xiàn)死機(jī),重啟等情況時(shí),都不影響數(shù)據(jù)的連續(xù)性。

明年,Memblaze會(huì)推出高性能和低功耗兩款產(chǎn)品,低功耗12瓦,高性能25瓦,滿足企業(yè)級(jí)的需求。

以下是張?zhí)?lè)先生演講內(nèi)容摘錄:

我首先介紹一下我的演講的題目,《NVMe SSD在企業(yè)級(jí)存儲(chǔ)的應(yīng)用》。大概從2012年開(kāi)始,NVMe標(biāo)準(zhǔn)正式發(fā)布到現(xiàn)在已經(jīng)五六年,且在整個(gè)數(shù)據(jù)中心已經(jīng)是非常廣泛的應(yīng)用。但是在企業(yè)級(jí),我所說(shuō)的是傳統(tǒng)的集中式存儲(chǔ)企業(yè)級(jí)存儲(chǔ)其實(shí)還沒(méi)怎么開(kāi)始。雖說(shuō)是沒(méi)怎么開(kāi)始,但是也許這個(gè)事情很快會(huì)在今年和明年有非常大的改變。

對(duì)傳統(tǒng)企業(yè)級(jí)集中式存儲(chǔ)情況的變化,剛才中存超為的沈總也介紹過(guò),他們的公司也在雙控,整個(gè)市場(chǎng)都處呼之欲出的狀態(tài),我也講一下最近Memblze在做哪些事情,給大家做一個(gè)分享。

Memblze是一個(gè)北京的小公司,成立于2011年,到現(xiàn)在差不多六七年的歷史。多年來(lái),我們專注做PCleSSD。到現(xiàn)在我們?nèi)匀荒軞W保持全球幾乎最快的性能。如果你在我們的展臺(tái)參觀,能夠看到我們得產(chǎn)品IOPS可以達(dá)到一百萬(wàn)。最近我們開(kāi)始追求更高的可用性,易用性,長(zhǎng)期以這樣的發(fā)展來(lái)打造我們的品牌。目前,Memblze在國(guó)內(nèi)有了自己的立足之地,我們的產(chǎn)品已經(jīng)應(yīng)用到了很多行業(yè)。

從超級(jí)互聯(lián)網(wǎng)到BAT,都有我們的產(chǎn)品部署。除此之外,我們的客戶也覆蓋了180家中國(guó)大大小小的云廠商??蛻艨倲?shù)量超過(guò)兩百多家,包括電信、金山云,很多的客戶都在用我們的產(chǎn)品。另外,一些國(guó)際一線品牌也在使用我們的產(chǎn)品。在市場(chǎng)銷(xiāo)售上,我們跟很多公司都有非常緊密的合作。Memblaze一共推出過(guò)五代產(chǎn)品,其實(shí)真正的從應(yīng)用場(chǎng)景來(lái)說(shuō),前三代產(chǎn)品還不是NVMe的,我們大概是在2015年,也是國(guó)內(nèi)第一個(gè)推出了NVMe的產(chǎn)品。

為什么叫NVMe,其實(shí)剛才中存也介紹了。比如說(shuō)一個(gè)盤(pán),最開(kāi)始一個(gè)盤(pán)大概可以有128個(gè)隊(duì)列,如果你有四千個(gè)CPO。我們現(xiàn)在很多是在盤(pán)上,比如說(shuō)Memblaze。

后面我給大家看,周末畫(huà)了NVMe過(guò)去和現(xiàn)在的變化。2014年,NVMe1.2的發(fā)布基本上使得卡或者盤(pán)這個(gè)級(jí)別變得比較的堅(jiān)實(shí)了。緊接著開(kāi)始在2015年的Q4發(fā)布了NVMe-MI 1.0。之后在2016年的Q2發(fā)布了NVMe-Of,同時(shí)更新了NVMe1.2.1。再就是今年的五月份發(fā)布了NVMe1.3。

到2020年,整個(gè)市場(chǎng)預(yù)計(jì)差不多能達(dá)到180億美金,這個(gè)數(shù)字比五年前高很多。中國(guó)差不多35億,也是很大的比重。我們?cè)貾Cle,2017年有一個(gè)很大的變化。我今天早晨聽(tīng)說(shuō)北美的一個(gè)大公司,一年為微軟供貨幾百萬(wàn)顆,這是非常大的量。

所以說(shuō)服務(wù)器存儲(chǔ),是一個(gè)已經(jīng)大規(guī)模部署的狀態(tài),如果大家再用服務(wù)器,我們一臺(tái)服務(wù)器上接一塊NVMe,有點(diǎn)晚了,不要被淘汰,是這么一個(gè)狀態(tài)。服務(wù)器NVMe能干什么呢,比如做緩存,做本地存儲(chǔ),做分布式存儲(chǔ),大規(guī)模數(shù)據(jù)中心做的事情全部是這一類(lèi)的,但是有一個(gè)領(lǐng)域,也就是SAS,依然非常強(qiáng)壯。這些系統(tǒng)NVMe剛剛開(kāi)始,這是個(gè)全新的興起的機(jī)會(huì),這是好事情,對(duì)我們廠家來(lái)講最喜歡這種事,因?yàn)橛猩饪梢宰觯@個(gè)是我們最想看到的一個(gè)事情。下面我著重講一下企業(yè)級(jí)存儲(chǔ)這一塊。

我班門(mén)弄斧的畫(huà)了一張典型企業(yè)級(jí)存儲(chǔ)架構(gòu),非常簡(jiǎn)單的一個(gè)結(jié)構(gòu),其實(shí)是什么呢,是兩個(gè)控制器,上面一個(gè)下面一個(gè),就像是一個(gè)傳統(tǒng)的SAS結(jié)構(gòu),通過(guò)了Storage、Controller。如果你要想很強(qiáng)的擴(kuò)展性,我們把它轉(zhuǎn)成SAS,SAS Expender可以連到所有SAS的盤(pán)上。NVMe很簡(jiǎn)單的,直接拿到PCle Switch。

就這樣大家也許不過(guò)癮,因?yàn)镻Cle有很大的問(wèn)題。首先,我們要做雙端口NVMe SSD。這樣,在單個(gè)鏈路出現(xiàn)掉電,斷路等情況,或單個(gè)主控出現(xiàn)死機(jī),重啟等情況時(shí),都不影響數(shù)據(jù)的連續(xù)性。

性能方面,Dual PCle3.0X2,可以實(shí)現(xiàn)Active-Active訪問(wèn)。并且對(duì)比SAS可發(fā)現(xiàn),3-4X具有更高的帶寬性能,2X則具備更好的延時(shí)。企業(yè)級(jí)特性方面,雙端口NVMe SSD具備端到端數(shù)據(jù)保護(hù)DIF/DIS,及安全TCG。

NVMe over Fabric高性能導(dǎo)出協(xié)議,可跨不同網(wǎng)絡(luò)實(shí)現(xiàn)端到端的NVMe協(xié)議,擴(kuò)展能力遠(yuǎn)好于Pcle,另外,它還具備業(yè)標(biāo)準(zhǔn)接口,更多的儲(chǔ)存系統(tǒng)交換機(jī),HBA供應(yīng)商,更容易實(shí)現(xiàn)高可用性。

下面,我想講一下NVMe企業(yè)級(jí)存儲(chǔ)系統(tǒng)對(duì)于SSD的挑戰(zhàn),第一個(gè)是SGL,當(dāng)你通過(guò)網(wǎng)絡(luò)去傳DMA是比較零散的,不像本地的DMA都是連續(xù)的,通過(guò)網(wǎng)絡(luò)發(fā)過(guò)來(lái)的數(shù)據(jù)非常零散。在零散的時(shí)候傳送的DMA,是不能很好的撼動(dòng)這個(gè)事情的。而NVMe支持SGL,系統(tǒng)無(wú)需額外的轉(zhuǎn)換。

CMB SSD端內(nèi)存,我們過(guò)去所有的CMD讀寫(xiě)在本地,通過(guò)DMA發(fā)送給盤(pán)不是問(wèn)題。有沒(méi)有辦法把命令直接寫(xiě)到盤(pán)上,我直接把我的內(nèi)容讓遠(yuǎn)端寫(xiě)進(jìn)來(lái),這是另外一個(gè)很企業(yè)級(jí)特性。更短的IO路徑,減少CPU處理,更低的Iatency。

虛擬化方面,SSD NVMe虛擬化,RDMA網(wǎng)卡虛擬化都可以實(shí)現(xiàn)。

另外一個(gè)我想說(shuō)的挑戰(zhàn)就是密度,企業(yè)級(jí)存儲(chǔ)系統(tǒng)具備高密度需求,超微48盤(pán)位雙端口SBB,Wiwynn60盤(pán)位;60,80甚至更高的雙端口系統(tǒng)正在設(shè)計(jì)中。

Memblaze支持雙端口,當(dāng)然也有一些不支持的,我們還在努力的做。到明年會(huì)推出高性能和低功耗兩款產(chǎn)品,低功耗12瓦,高性能25瓦。這兩個(gè)產(chǎn)品我們?cè)?018年的時(shí)候會(huì)發(fā)布,可以說(shuō)Memblaze在明年全部是滿足企業(yè)級(jí)的需求。

謝謝大家。

分享到

sunk

相關(guān)推薦