宋慶春指出:傳統(tǒng)的馮?諾依曼架構以CPU為中心的時代應該被以數(shù)據(jù)為中心的時代所代替,原因很簡單,數(shù)據(jù)已經(jīng)替代計算成為業(yè)務發(fā)展的核心,數(shù)據(jù)中心架構應該圍繞數(shù)據(jù)配置資源,計算、存儲和網(wǎng)絡通信都應該圍繞著數(shù)據(jù),而不應該以CPU計算為核心。
“數(shù)據(jù)在哪里,計算就在那里;當數(shù)據(jù)在GPU上,計算就在GPU上;當數(shù)據(jù)在CPU上,計算就在CPU上;當數(shù)據(jù)在網(wǎng)絡中傳輸?shù)臅r候,計算就在網(wǎng)絡中?!彼螒c春說。
以OVS(Open VSwitch)虛擬交換機組成的虛擬網(wǎng)絡應用為例,使用CPU運行OVS的效率不高,同時也存在長尾延時的問題,原因很簡單,通用處理器核處理虛擬網(wǎng)絡應用,在網(wǎng)絡交互過程中延遲很大,導致效率不高。在這種情況下,就是適合把OVS操作放在DPU,不僅包轉(zhuǎn)發(fā)率大幅度提升,同時也實現(xiàn)了OVS操作和CPU業(yè)務之間的隔離,大幅降低了長尾延時。
類似的,NVIDIA與VMware合作的Project Monterey也是將ESX的Hypervisor從CPU卸載到DPU上。
在安全、網(wǎng)絡、存儲、AI/HPC等很多應用場景,都可以使用DPU對于CPU進行卸載,以充分發(fā)揮CPU計算的資源,讓數(shù)據(jù)創(chuàng)新應用敏捷高效?! ?/p>
UCloud基于英偉達DPU DOCA生態(tài),大膽進行了技術實踐。 據(jù)UCloud資深技術專家馬彥青介紹,他們基于NVIDIA DPU使用ASAP2做網(wǎng)絡的卸載;使用SNAP/Virtio BLK SNAP來做存儲的卸載;使用ARM處理器來做上面服務的編排管理;利用DPI深度包檢測功能做正則表達式的算法卸載;以及安全加解密的卸載,包括TLS、SSL以及IPSec這些算法;通過InfiniBand網(wǎng)絡以及RDMA做數(shù)據(jù)的加速傳輸。
而DPU&DOCA簡化了UCloud裸金屬的網(wǎng)絡架構。原來的VPC網(wǎng)關架構,需要使用很多的網(wǎng)關服務器集群來進行管理,而這些網(wǎng)關集群的成本也更高,而且當跨網(wǎng)關的時候會存在帶寬的瓶頸。而采用英偉達的DPU之后,就可以將VPC管理整個集成到DPU內(nèi)部,OVS包轉(zhuǎn)發(fā)以及GRE封裝都可以通過ASIC硬件來實現(xiàn)。UCloud原來10G網(wǎng)卡升級到25G,新版可以達到50G。DPU的采用能統(tǒng)一裸金屬與快杰主機網(wǎng)絡VPC,大大提高連接效率。
這樣做的目的只有一個:借助DPU的能力,提高網(wǎng)絡通信、數(shù)據(jù)存儲和傳輸?shù)男?,以及提供安全性保?--,從而減少CPU在處理這些任務時的等待和開銷。在很多應用場景中,網(wǎng)絡、外部數(shù)據(jù),以及安全處理能力完全沒有辦法很好地匹配CPU的計算能力,存在著等待和延遲,如今,借助DPU卸載,就可以輕裝上陣,充分釋放數(shù)據(jù)計算的潛力。
針對數(shù)據(jù)為中心架構的新格局,英偉達DPU不斷進階,繼去年發(fā)布了第一款DPU產(chǎn)品BlueField-2,今年的GTC上又發(fā)布了BlueField-3,會在明年上半年推向市場。從BlueField-2到BlueField-3,它的整形計算能力提升了5倍。BlueField-2 目前為軟件定義的網(wǎng)絡安全和存儲卸載了相當于125 個CPU核的工作量,而BlueField-3則能達到300個CPU核。
為了推動DPU應用,NVIDIA發(fā)布了DOCA軟件棧,DOCA之于DPU,就好比CUDA對于GPU在AI應用張的作用。DOCA提供了各種各樣的技術:深度包檢測、安全引導、TLS加密卸載、正則表達式加速,以及一個非常令人興奮的能力,一個基于硬件的實時時鐘,可以用于同步數(shù)據(jù)中心、5G和視頻廣播?,F(xiàn)在其第一版DOCA1.0已經(jīng)正式發(fā)布了,用戶已經(jīng)可以從官網(wǎng)下載使用。
如果能力足夠,DOCA可以讓你:想卸載什么,就卸載什么。但是卸載不是目的,目的只有一個:充分釋放數(shù)據(jù)的潛力。