2.RDMA技術(shù),降低60%鏈路時延

RDMA(Remote Direct Memory Access)是“遠(yuǎn)程直接數(shù)據(jù)存取”,通過網(wǎng)絡(luò)把數(shù)據(jù)直接傳入計算機(jī)的存儲區(qū),將數(shù)據(jù)從一個系統(tǒng)快速移動到遠(yuǎn)程系統(tǒng)存儲器中,而不對操作系統(tǒng)造成任何影響,這樣就不需要用到多少計算機(jī)的處理能力。因而能騰出總線空間和CPU周期,用于改進(jìn)應(yīng)用系統(tǒng)性能。華為存儲協(xié)議處理芯片支持硬件級RDMA,在多個存儲控制器之間通過RDMA進(jìn)行數(shù)據(jù)傳輸和交換,從而降低鏈路上時延超過60%,極大地提升客戶在多并發(fā)和高負(fù)載業(yè)務(wù)下的處理效率。基于10GE,在8并發(fā)、8KB IO大小,時延測試結(jié)果如下:

3.針對WAN優(yōu)化,減少廣域網(wǎng)擁塞,提升復(fù)雜組網(wǎng)場景下遠(yuǎn)程復(fù)制帶寬

WAN優(yōu)化即廣域網(wǎng)優(yōu)化,通過各種技術(shù)手段削減廣域網(wǎng)數(shù)據(jù)傳輸量、優(yōu)化廣域網(wǎng)上的數(shù)據(jù)通信,提升廣域網(wǎng)帶寬利用率。WAN優(yōu)化從部署方式上分為單邊優(yōu)化和雙邊優(yōu)化:單邊優(yōu)化主要采用流控和TCP優(yōu)化技術(shù);雙邊優(yōu)化主要采用緩存和壓縮技術(shù)。

華為存儲協(xié)議處理芯片內(nèi)嵌QoS流控和TCP擁塞算法技術(shù),在客戶復(fù)雜組網(wǎng)場景,比如連接不同地區(qū)的局域網(wǎng)或城域網(wǎng)的計算機(jī)通信的遠(yuǎn)程網(wǎng),甚至跨接很大的物理范圍,所覆蓋的范圍從幾十公里到幾百公里連接多個城市情況下,通過實(shí)時偵測網(wǎng)絡(luò)數(shù)據(jù)包RTT時延、丟包率、ECN等,配合多種TCP擁塞算法,調(diào)整發(fā)送和接收策略,包括重試策略、收/發(fā)Buffer窗口、智能流控等手段,動態(tài)的針對某些鏈路傳輸擁塞進(jìn)行規(guī)避和緩解,達(dá)到比普通網(wǎng)卡跑得更快的目的。WAN加速在復(fù)雜組網(wǎng)下可提升65%~400%的廣域網(wǎng)性能。

二.IO處理加速芯片

云服務(wù)時代帶來數(shù)據(jù)超預(yù)期增長的同時,也帶來了大量的重復(fù)數(shù)據(jù),這些重復(fù)數(shù)據(jù)給企業(yè)帶來的價值十分有限,卻大量占用存儲空間、增加能耗和散熱成本,而且會降低系統(tǒng)的數(shù)據(jù)訪問性能、消耗企業(yè)有限的IT預(yù)算。企業(yè)迫切希望有一種方法能夠保證原有數(shù)據(jù)的訪問性能,并在此基礎(chǔ)上減少重復(fù)數(shù)據(jù)。

業(yè)內(nèi)普遍采用重刪和壓縮技術(shù)來解決這個問題,但是重刪壓縮涉及到大量的指紋和壓縮、解壓縮算法,對CPU占用率較高,一旦開啟會顯著影響業(yè)務(wù)性能,因此傳統(tǒng)存儲都采用后重刪壓縮技術(shù)。對用戶來說,后重刪壓縮技術(shù)無法減少客戶預(yù)留存儲空間,不能減少首次購置成本,同時更多的數(shù)據(jù)寫入,也影響SSD壽命。

華為IO處理加速芯片集成壓縮、解壓算法引擎,將壓縮和解壓縮等比較消耗計算資源的工作卸載到算法引擎,有效降低CPU負(fù)載。根據(jù)實(shí)際測試,在順序大IO場景下,CPU占用率減少24.6%,IOPS提升342.4%,時延縮短77.4%。

三.SSD控制芯片

華為自研SSD使用新一代自研的SSD控制芯片,采用了計算能力更強(qiáng)的Cortex-A9芯片,支持DDR4,多達(dá)18個NAND Flash通道,采用了硬件FTL(Flash Translation Layer)技術(shù)加速IO處理,實(shí)現(xiàn)200K IOPS能力。

華為自研SSD性能數(shù)據(jù)

1.硬件FTL,低負(fù)載時延比業(yè)界低20%

FTL(Flash Translation Layer)是SSD盤片內(nèi)部的一個核心數(shù)據(jù)結(jié)構(gòu),用來保存用戶LBA到SSD盤內(nèi)物理頁面的映射關(guān)系,用戶讀寫數(shù)據(jù)時帶下來一個LBA地址,SSD盤接收到以后,從FTL表中查詢到該LBA地址所對應(yīng)的物理頁面,即可實(shí)現(xiàn)數(shù)據(jù)的讀取。傳統(tǒng)的SSD讀取數(shù)據(jù)的時候,SSD內(nèi)部控制軟件查找到LBA地址對應(yīng)的物理地址,然后再從Flash中讀取對應(yīng)的數(shù)據(jù)返回給主機(jī);寫入數(shù)據(jù)的時候,軟件寫入完畢后,再去更新FTL映射表。華為自研SSD使用硬件加速FTL表管理,所有讀取和寫入FTL的操作全部由硬件完成,減少軟件交互次數(shù),減小IO的延時,在低負(fù)載場景下時延低至40μs,比業(yè)界低20%。

2.FlashLink技術(shù)保障全閃存陣列,實(shí)現(xiàn)平均穩(wěn)定時延0.5ms

FlashLink技術(shù)是基于華為自研SSD盤和自研存儲操作系統(tǒng),實(shí)現(xiàn)盤控聯(lián)動配合的軟硬件垂直優(yōu)化技術(shù),保障華為OceanStor Dorado V3全閃存存儲系統(tǒng)實(shí)現(xiàn)平均穩(wěn)定時延0.5ms。

FlashLink技術(shù)示意圖

冷熱數(shù)據(jù)分區(qū)提供多個數(shù)據(jù)分區(qū),自研存儲操作系統(tǒng)在訪問SSD盤片時,將數(shù)據(jù)的冷熱標(biāo)示發(fā)給SSD,SSD控制芯片根據(jù)數(shù)據(jù)冷熱標(biāo)識將冷熱數(shù)據(jù)分開存放,從而降低SSD垃圾回收的搬移數(shù)據(jù)量,寫放大降低約40%,時延降低20%。

IO優(yōu)先級調(diào)度提供多個IO優(yōu)先級調(diào)度能力,為保證穩(wěn)定時延,自研存儲操作系統(tǒng)對IO優(yōu)先級別進(jìn)行了標(biāo)識。比如,主機(jī)讀請求的優(yōu)先級高于Flash Cache刷盤請求,F(xiàn)lash Cache刷盤寫請求優(yōu)先級高于異步復(fù)制的后臺拷貝IO。IO優(yōu)先級隨著讀寫請求一起發(fā)給SSD,SSD控制芯片接收到IO時,根據(jù)IO的優(yōu)先級標(biāo)識優(yōu)先處理高優(yōu)先級IO,從而實(shí)現(xiàn)端到端的IO優(yōu)先級控制,保障優(yōu)先的業(yè)務(wù)數(shù)據(jù)讀寫在第一順序響應(yīng)。

總結(jié)

華為存儲在自研芯片研發(fā)上持續(xù)投入和技術(shù)創(chuàng)新,幫助企業(yè)應(yīng)對數(shù)字洪流挑戰(zhàn),進(jìn)行數(shù)字化轉(zhuǎn)型。

協(xié)議處理芯片以All IP為戰(zhàn)略,覆蓋前端網(wǎng)絡(luò)、交換網(wǎng)絡(luò)、后端網(wǎng)絡(luò)、復(fù)制/雙活網(wǎng)絡(luò),構(gòu)建大規(guī)模、低時延網(wǎng)絡(luò)能力;IO處理加速芯片以SOC為方向,集成存儲和網(wǎng)絡(luò)加速功能,持續(xù)優(yōu)化計算、存儲、網(wǎng)絡(luò)能力;SSD控制芯片以介質(zhì)為核心,匹配介質(zhì)演進(jìn)節(jié)奏,針對介質(zhì)特性進(jìn)行優(yōu)化,充分發(fā)揮新介質(zhì)優(yōu)勢。

通過技術(shù)創(chuàng)新和軟硬件芯片垂直優(yōu)化,華為存儲致力于消除CPU、介質(zhì)、網(wǎng)絡(luò)發(fā)展不均衡導(dǎo)致的鴻溝,為客戶提供更快、更好、更省的產(chǎn)品和解決方案,與客戶一起實(shí)現(xiàn)商業(yè)成功。

分享到

崔歡歡

相關(guān)推薦