如今,宏杉全閃存存儲陣列也采用了越來越多的國產(chǎn)器件,支持海光、飛騰兩款國產(chǎn)CPU,與國內(nèi)NVMe硬盤廠商廣泛合作。在今年隨著RoCE技術(shù)的發(fā)展,宏杉總結(jié)了研發(fā)過程和用戶實施的經(jīng)驗,發(fā)布了基于25G以太網(wǎng)的全I(xiàn)P數(shù)據(jù)中心解決方案,提升數(shù)據(jù)在存儲網(wǎng)絡(luò)中的傳輸性能,更好地發(fā)揮閃存的優(yōu)勢。
宏杉科技全閃存家族系列,包括主打高性能Mach系列,IOPS最高性能可達(dá)1100萬,AFT系列主打擴(kuò)展性全閃存應(yīng)用,該系列可支持28個接口卡,可支持38400塊硬盤。另外就是AF系列,主打性價比。
如今行業(yè)應(yīng)用市場的狀況是各種各樣新應(yīng)用層出不窮,如互聯(lián)網(wǎng)金融、物聯(lián)網(wǎng)、AI、超算、自動駕駛等,這些新應(yīng)用帶來了巨大數(shù)據(jù)處理需求,同時也需要高性能存儲。以超算為例,動輒上百個計算節(jié)點構(gòu)成計算集群,需要實時進(jìn)行大量數(shù)據(jù)的分發(fā)、同步和交互;再例如AI模型訓(xùn)練,大量GPU運算需要底層數(shù)據(jù)系統(tǒng)快速提供數(shù)據(jù)資源,需要高吞吐量數(shù)據(jù)帶寬支持,隨著GPU性能快速提高,存儲系統(tǒng)性能瓶頸的問題凸顯。
應(yīng)對這些新型應(yīng)用的存儲答案就是全閃存,無論性能、成本都是未來方向。全閃存存儲時代已經(jīng)到來。越來越多的全閃存存儲正在由SATA SSD、SaaS SSD升級到NVMe SSD。NVMe SSD帶來了存儲設(shè)備性能的巨大增長,如此性能瓶頸也逐漸轉(zhuǎn)移到存儲網(wǎng)絡(luò)上,以往的FC SAN、IP SAN已經(jīng)不能完全釋放全閃存存儲性能。
需要構(gòu)建更高速的存儲網(wǎng)絡(luò),以實現(xiàn)數(shù)據(jù)中心端到端NVMe存儲系統(tǒng)性能的提升。原生的NVMe,是固態(tài)盤完全通過PCIe連接到CPU。如今NVMe已經(jīng)可以擴(kuò)展到各種類型網(wǎng)絡(luò)上,也就是NVMe over Fabrics。IDC統(tǒng)計數(shù)據(jù)顯示:2021年中國63.1%的全閃存存儲陣列已經(jīng)部署了NVMe over Fabrics。
宏杉引領(lǐng)NVMe技術(shù)發(fā)展,先后發(fā)布了多款NVMe全閃存存儲陣列,形成了獨具特色的各異NVMe全閃存存儲家族,既有盤控分離,也有盤控一體;有主打性能,也有主打擴(kuò)展性的,本次分享的端到端超高性能NVMe全閃存存儲方案,就是依托于Mach系列的NVMe全閃存存儲陣列
宏杉Mach系列產(chǎn)品針對NVMe協(xié)議采用了全新的硬件構(gòu)架和軟件算法,全方位地釋放了閃存顆粒的性能。Mach閃存介質(zhì)與CPU采用NVMe協(xié)議進(jìn)行數(shù)據(jù)交換,采用PCIe總線連接,不再有繁雜協(xié)議轉(zhuǎn)換。其中MS7000G2-Mach系列產(chǎn)品,雙控配有50塊NVMe SSD盤,每塊NVMe SSD全部配置兩個PCIe3.0的接口,分別和兩個控制器直接進(jìn)行數(shù)據(jù)交換,每塊SSD均有自己獨立數(shù)據(jù)通道,而不是多塊硬盤復(fù)用數(shù)據(jù)通道。MS7000G2-Mach可以提供1600GBPS后端總帶寬,釋放后端閃存介質(zhì)性能,解決后端鏈路的瓶頸。
2020年10月,MS7000G2-Mach在全球權(quán)威存儲性能測試組織SPC-1的性能測試下,實現(xiàn)了1100萬IOPS、最高壓力時延是0.337ms、總體時延0.264ms的成績,這個性能全球領(lǐng)先。此外,存儲網(wǎng)絡(luò)帶來的延時所占比例凸顯,是整個存儲系統(tǒng)性能的瓶頸。
2021年數(shù)據(jù)中心超過50%的以太網(wǎng)交換機(jī)已升級到25/100G,25GE、100GE發(fā)貨量快速地增長,基于NVMe over RoCE已經(jīng)成為存儲解決方案共識。宏杉基于NVMe over RoCE構(gòu)建了全I(xiàn)P數(shù)據(jù)中心解決方案,通過了無損以太網(wǎng)交換機(jī)ECM、PFC等關(guān)鍵技術(shù),宏杉搭建了高性能無損存儲訪問網(wǎng)絡(luò),在某大銀行總部的客戶測試中,對比25GE NVMe over RoCE和32G FC SAN,數(shù)據(jù)表明,基于25GE RoCE環(huán)境下,4K隨機(jī)讀寫IOPS時延普遍地好于32G FC SAN的環(huán)境,由此確認(rèn)了:在性能上,RoCE實現(xiàn)了對FC的替代和趕超,標(biāo)準(zhǔn)RoCE并非完美。
傳統(tǒng)標(biāo)準(zhǔn)以太網(wǎng)缺乏故障主動發(fā)現(xiàn)和通知機(jī)制,存儲端發(fā)生端口或者鏈路故障時,需要應(yīng)用多次發(fā)送失敗后,才會檢測到故障,由此造成鏈路切換時間長,嚴(yán)重時甚至?xí)?dǎo)致存儲業(yè)務(wù)中斷。此外,在應(yīng)用性方面,傳統(tǒng)以太網(wǎng)絡(luò)需要逐點手工配置,操作復(fù)雜且容易出錯。
為了提高RoCE SAN的可用性和易用性,宏杉自研了SNSD,也就是存儲網(wǎng)絡(luò)智能發(fā)現(xiàn)查檢,由此實現(xiàn)了存儲端服務(wù)器與交換器的智能聯(lián)動,共同去實現(xiàn)存儲設(shè)備的即插即用,故障快速切換。宏杉實現(xiàn)了iNOF,也就是智能無損存儲網(wǎng)絡(luò)場景下的多路徑軟件,在存儲鏈路或者端口出現(xiàn)故障時,可以和宏杉自研的多路徑軟件進(jìn)行配合,實現(xiàn)路徑的秒級切換。
宏杉自研了iNOF環(huán)境下的雙活技術(shù),實現(xiàn)了存儲設(shè)備在NVMe over Fabrics環(huán)境下的可靠災(zāi)備,實現(xiàn)了雙活鏈路的長距離無損切換。宏杉SNSD插件能夠與交換機(jī)配合,當(dāng)存儲端發(fā)生鏈路端口故障的時候,存儲網(wǎng)絡(luò)可以實時感知并快速地告知服務(wù)器進(jìn)行一個鏈路切換。配合宏杉的多路徑軟件,可以做到一個秒級的存儲的切換訪問。如果有交換設(shè)備、主機(jī)甚至存儲在iNOF網(wǎng)絡(luò)中接入或者離線,它都會在特定的時間之內(nèi),做這個信息一個發(fā)布,存儲網(wǎng)絡(luò)會自動地響應(yīng)。通過iNOF以后,可以把整個存儲系統(tǒng),它的這個網(wǎng)絡(luò)的切換速度控制在500毫秒之內(nèi)。
宏杉自研的SNSD技術(shù),可以與iNOF交換機(jī)聯(lián)動,實現(xiàn)僅需要在單點配置存儲網(wǎng)絡(luò)以后,自動地同步到全網(wǎng),進(jìn)而實現(xiàn)宏杉存儲設(shè)備的即插即,一鍵式擴(kuò)容,從而大大簡化了運維。
另外,宏杉NVMe over RoCE不限于一個數(shù)據(jù)中心內(nèi)部,也可以用于兩個甚至多個數(shù)據(jù)中心之間,也能夠基于RoCE去構(gòu)建無損后端訪問網(wǎng)絡(luò),如雙活,通過無損網(wǎng)絡(luò)搭建,同步復(fù)制實現(xiàn)了數(shù)據(jù)長距離傳輸零丟包、高性能。宏杉端到端超高性能NVMe全閃存存儲解決方案,可以滿足各行業(yè)核心業(yè)務(wù)性能需求。
宏杉與麒麟、CentOS、英特爾、鯤鵬、海光等軟硬件主流廠商進(jìn)行了充分測試和認(rèn)證,在實際項目、在研發(fā)過程中,都有著深度的合作。宏杉產(chǎn)品和華為、H3C、紫光的無損交換機(jī)都可以進(jìn)行兼容擁有著完善的生態(tài)。
最后看兩個案例,一個是浙江石油,他們的ERP包含全省的零售系統(tǒng),大概有1000多個加油站,晝夜不停地進(jìn)行服務(wù)。其后端就采用宏杉NVMe直連架構(gòu)的MS7370G2-Mach,在業(yè)務(wù)的高峰,其讀寫平均時延穩(wěn)定在60微秒左右,讀寫緩存命中率穩(wěn)定在95%以上,滿足了用戶超高的性能需求。
第二個是貴陽農(nóng)商行,采用了端到端NVMe解決方案進(jìn)行數(shù)據(jù)中心的建設(shè)。采用了NVMe over RoCE網(wǎng)絡(luò),宏杉幫助客戶打通了云平臺、操作系統(tǒng)、服務(wù)器、存儲之間的鏈路,以NVMe-OF的方式為基礎(chǔ)數(shù)據(jù)中心提供端到端的解決方案,簡化運維,提高了數(shù)據(jù)存儲的性能,同時避免了FC產(chǎn)品使用,滿足了國家對信創(chuàng)的要求。
最后總結(jié)一下,宏杉科技端到端超高性能NVMe全閃存存儲解決方案有兩個技術(shù)要點:
1.NVMe直連架構(gòu),構(gòu)建高性能存儲系統(tǒng),25GE/100GE高帶寬、低延遲RoCE訪問鏈路,實現(xiàn)無損網(wǎng)絡(luò),實現(xiàn)數(shù)據(jù)零丟包。
2.基于RoCE開發(fā)的端到端智能存儲網(wǎng)絡(luò),自研的SNSD插件,與iNOF交換機(jī)智能聯(lián)動,配合自研iNOF多路徑雙活,賦予了RoCE網(wǎng)絡(luò)即插即用,故障快速切換的特性。
宏杉解決方案總結(jié)下來有三個優(yōu)點:
1.構(gòu)建了全I(xiàn)P網(wǎng)絡(luò)架構(gòu),簡化了運維。
2.充分發(fā)揮了NVMe的特性,性能更優(yōu)。
3.所有的器件生態(tài)非常地成熟,成本更低。
以上是宏杉科技端到端超高性能NVMe全閃存存儲解決方案的介紹,感謝大家!
(根據(jù)宏杉科技產(chǎn)品部總工程師單東來演講整理而成,未經(jīng)本人確認(rèn))