同有飛驥研發(fā)中心規(guī)劃管理部總監(jiān)尹微
以下為速記內(nèi)容,未經(jīng)演講人確認(rèn):
首先做一下自我介紹,本人是同有飛驥的研發(fā)總監(jiān),主要負(fù)責(zé)分布式存儲研發(fā)和云計(jì)算存儲研發(fā)。今天我為大家來介紹一下同有飛驥公司在擁抱高速介質(zhì)這一塊的新技術(shù)研究。我特意沒在這里提到閃存,因?yàn)楦咚俳橘|(zhì)不僅局限于閃存,還有其他的介質(zhì)。今天,我主要從三個(gè)方面進(jìn)行介紹。
首先講一下企業(yè)級存儲的創(chuàng)新,存儲創(chuàng)新背后存在一些推動(dòng)力,具體有哪些推動(dòng)力呢?首先從介質(zhì)上講,過去的很多年里,計(jì)算、網(wǎng)絡(luò)都經(jīng)歷了快速的發(fā)展,比如CPU從很早以前幾百GB的頻率,發(fā)展到后面的3G、4G、多核,網(wǎng)絡(luò)也是從十GB發(fā)展到幾百GB。但我們存儲卻是一直被垢病的,在2011-2012年發(fā)生了巨大的變革,很多的初創(chuàng)存儲公司,在閃存的助力下,存儲有了很大的提升。最近一兩年,一個(gè)新的介質(zhì)——SCM(Storage Class Memory)出現(xiàn)了。它又分為兩個(gè)派系,第一個(gè)派系是相變存儲,比如IBM的一個(gè)技術(shù);另外一個(gè)就是英特爾和鎂光,他們合作研發(fā)了一款叫做3D Xpoint。
接下來,我首先為大家介紹所有這些介質(zhì)的特點(diǎn),以及我們做存儲系統(tǒng)要怎么用?
首先我們看傳統(tǒng)的旋轉(zhuǎn)型磁盤,這里有一些非常樂觀的參數(shù),比如SAS是最新的3.0的參數(shù),最小I/O的大小,隊(duì)列深度,延遲,IOPS,如果一直上電,也許3年就壞掉了。還有NAND閃存,到現(xiàn)在的3D NAND,我們看到其實(shí)有很大的提升,最小I/O單位變成了4K。我們知道很多時(shí)候IT的發(fā)展,往往是新舊變革的發(fā)展,所以意味著當(dāng)一個(gè)新技術(shù)發(fā)生的時(shí)候,我們新的軟件硬件的升級,還要相應(yīng)的去支持已有的技術(shù)。
SCM介質(zhì)具體使用有兩種方式,第一做NVMe SSD,第二是NVRAM,他們的區(qū)別是,一個(gè)是4K字節(jié)訪問,還有一個(gè)1-2字節(jié),從而決定了他們到底是做主存儲,還是內(nèi)存。另外一個(gè)是DRAM,對存儲的要求主要是持續(xù)存儲。五年以前,國外初創(chuàng)公司主推NAND閃存,帶來了性能的快速提升。那么,最近兩年SCM的出現(xiàn),將會帶來軟件的變革。這兩類的高速介質(zhì),將會推動(dòng)我們企業(yè)級的存儲交替地進(jìn)行硬件和軟件的相關(guān)更新。
剛才講的高速介質(zhì)的第一推動(dòng)力,第二推動(dòng)力是網(wǎng)絡(luò)。
FC-NVMe和NVMe-Of為企業(yè)SAN端到端的賦予了全棧低延遲和高并行的特性。FC-NVMe有一個(gè)特點(diǎn),它本身支持DMA直接內(nèi)存訪問。直接在基于FC協(xié)議通道之上,再加上NVMe,可以幫助客戶保護(hù)現(xiàn)有投資,同時(shí)實(shí)現(xiàn)單個(gè)HBA同時(shí)支持NVMe和SCSI。2012年,也出現(xiàn)了類似的技術(shù),比如思科推出的FCoE。
第二類是我們經(jīng)常看到的NVMe Over Fabric,它也是一個(gè)基于RDMA的技術(shù),也就是說它是一個(gè)基于以太網(wǎng)的技術(shù)。因此,在驅(qū)動(dòng)方面有所欠缺,目前只針對Linux,而云環(huán)境是則基于Linux。最后,它還可以實(shí)現(xiàn)SCSI到NVMe的低延遲和高并行。
第三個(gè)分析,就是具體每一塊盤。目前現(xiàn)有的盤,大部分都是SAS或SATA通道的SSD。如果實(shí)現(xiàn)了PCIe接口之上,其潛能可以更快地發(fā)揮出來。
存儲位于整個(gè)IT系統(tǒng)的底層,包括網(wǎng)絡(luò)、計(jì)算,如何讓存儲更加重要,更加有價(jià)值呢?我們知道存儲的發(fā)展其實(shí)有很多全新的概念出現(xiàn),如大數(shù)據(jù)、人工智能等。大數(shù)據(jù)這個(gè)概念2011年由麥肯錫提出,人工智能也是很多年就有。我的觀點(diǎn)是,現(xiàn)有的新應(yīng)用和新負(fù)載帶來的是基于大數(shù)據(jù)的大數(shù)據(jù)。如今,以物聯(lián)網(wǎng),社交網(wǎng)絡(luò)為代表的應(yīng)用需求巨大,如果將他們轉(zhuǎn)換為代碼來看,可將他們分類為管理、操作、非結(jié)構(gòu)化、AI Apps四類。這些數(shù)據(jù)都是基于現(xiàn)有的原始數(shù)據(jù)產(chǎn)生新的數(shù)據(jù),不斷的產(chǎn)生新的數(shù)據(jù),即元數(shù)據(jù),它會在任何時(shí)間任何地點(diǎn)產(chǎn)生,而且一直在運(yùn)行,永遠(yuǎn)是熱數(shù)據(jù)。這些新的需求,也會推動(dòng)存儲的變革。
下面我們看另外一個(gè)需求,以最近國內(nèi)發(fā)生的安全時(shí)間為例來看,如果要做好中國人自己的存儲,一定要做好自己的自主可控?!白灾骺煽亍笔且粋€(gè)生態(tài),從閃存顆粒,到盤、主板,再到國產(chǎn)CPU、操作系統(tǒng),再到網(wǎng)絡(luò)。如何做到完全國產(chǎn)化,我相信同有就是這個(gè)顛覆者和破局者,推動(dòng)整個(gè)產(chǎn)業(yè)的發(fā)展。
下面,我為大家介紹同有科技在高速介質(zhì)方面的實(shí)踐。首先,我們存儲支持閃存和SCM。閃存方面,我們支持NVMe SSD和NVRAM。如何應(yīng)用呢?我們會在同一個(gè)存儲系統(tǒng)里面,把NVMe SSD主要用于海量數(shù)據(jù)的存儲,因?yàn)樗淖钚∽止?jié)是4K;在處理需要以字節(jié)為單位的大數(shù)據(jù)時(shí),我們會將它放在NVRAM里。
而針對這些介質(zhì),也勢必要做一些軟件上的創(chuàng)新,才可進(jìn)行很好的支持,從而為應(yīng)用服務(wù)。以上您看到的所有全閃存技術(shù)都已經(jīng)產(chǎn)品化了。
此外,同有科技在高速介質(zhì)方面還實(shí)現(xiàn)了端到端IO路徑優(yōu)化,應(yīng)用支持下沉,全國產(chǎn)研發(fā)落地。
最后,我們再看看同有科技真正落地的存儲產(chǎn)品有哪些。剛才講到了高速介質(zhì),最終還是要用的,我們的全閃存分兩個(gè)產(chǎn)品系列。第一個(gè)是同有NetStor NCS全閃存陣列產(chǎn)品系列。既支持經(jīng)典的工業(yè)接口FC、iSCSI、IB,也支持NVMe-oF接口RoCE, RoCEv2,iWARP。軟件方面,支持CPU多核心軟件優(yōu)化,NVMe軟件棧優(yōu)化。單個(gè)BBU最低時(shí)延低于200微秒 ,單個(gè)BBU可達(dá)400萬IOPS、15GBps帶寬。該產(chǎn)品具備了傳統(tǒng)的企業(yè)級的功能。
另外一個(gè)是同有的分布式產(chǎn)品,NetStor NCS10000閃存分布式產(chǎn)品系列。它支持多種先進(jìn)的技術(shù)。它的分布式主要變現(xiàn)在:
所以說,閃存和SCM帶來的不僅僅硬件、介質(zhì)或者是存儲參數(shù)上的變更,其實(shí)它解決了諸如大數(shù)據(jù),時(shí)時(shí)AI,語音業(yè)務(wù)等以前無法解決的問題。有了新介質(zhì)以后,我們從一些軟件架構(gòu)和內(nèi)核上進(jìn)行修改,從而解決更多新的東西。這也是因?yàn)橐恍┬聭?yīng)用,新架構(gòu)和新的介質(zhì),推動(dòng)著整個(gè)存儲行業(yè)架構(gòu)的軟、硬件交替更新,從而推動(dòng)了全閃存行業(yè)的發(fā)展。