宋慶春表示:云原生超級計算強調(diào)的是由CPU、GPU和DPU所構(gòu)成的混合架構(gòu),其中,CPU、GPU承擔(dān)計算的任務(wù),DPU則用于承擔(dān)網(wǎng)絡(luò)、存儲等協(xié)議的調(diào)度、解析,此前這些工作由CPU承擔(dān),DPU對其進行了卸載。
談到用DPU進行卸載的原因,是因為在傳統(tǒng)的架構(gòu)中,計算、通信在協(xié)同中存在很多問題,如計算同步過程中,通信等原因?qū)е翪PU空閑等待,例如不同應(yīng)用計算所導(dǎo)致的噪聲、干擾、性能抖動等問題,種種原因都會導(dǎo)致CPU資源利用率不高,得不到充分利用。
新的解決辦法就是引入DPU,對CPU的工作進行卸載。
其實,這就類似于最初引入GPU對圖形處理進行加速一樣,DPU的引入也是對于一些專用的處理進行硬件的加速,例如通信、存儲、安全、加密等相關(guān)的處理,從而提升系統(tǒng)整體的處理能力。這是一個合久必分的過程。
為了幫助用戶和開發(fā)者更好的使用DPU,英偉達配套提供了DOCA軟件平臺,其中針對安全、網(wǎng)絡(luò)、存儲提供了各種編排、調(diào)度的加速協(xié)議庫,方便用戶使用。
如今,DPU的性能不斷提升,以英偉達的BlueField-3為例,相比上一代產(chǎn)品,其網(wǎng)絡(luò)帶寬提高到了400Gb/s,RDMA 傳輸?shù)叵⒙剩╩essage rate) 提升到了370Mpps,其內(nèi)存帶寬也提高到80GB/s,大約有5倍左右的提升。
對于超級計算而言,新的云原生超級計算架構(gòu)堪稱如虎添翼,在最新的HPC Top500排行榜中,英偉達GPU、InfiniBand網(wǎng)絡(luò)取得了不菲的成績。其中,搭載 InfiniBand 網(wǎng)絡(luò)和GPU的超級計算系統(tǒng)在節(jié)能的表現(xiàn)格外優(yōu)異,獲列 Green500 的第一名。
從超級計算的應(yīng)用實踐來看,DPU+InfiniBand網(wǎng)絡(luò)的方案,在分子動力學(xué)模型、數(shù)據(jù)建模、天氣預(yù)告模型等應(yīng)用上效果顯著。
盡管“山還是那座山,梁也還是那道梁”,但是在架構(gòu)上稍加改變,帶來的效果,堪稱超乎預(yù)料。
不僅僅是DPU,具有SHARP技術(shù)的交換機計算輸出,也會帶來新的革新和改變,突破了傳統(tǒng)地認(rèn)知,應(yīng)用獲得了超過理論帶寬地更高地Allreduce帶寬,如200Gb/s的網(wǎng)絡(luò)提供260Gb/s的帶寬。
新的架構(gòu)為云計算帶來了新面貌,以往受制于多應(yīng)用對資源的爭奪,云在應(yīng)對類似超級計算應(yīng)用的時候,常常會表現(xiàn)出性能不佳,達不到預(yù)期。但有了新架構(gòu)的加持,特別是應(yīng)用的性能隔離,實現(xiàn)了在云上和在獨立的超算中心同樣的性能,為云超級計算開辟了新的前景。我想,也許這是新架構(gòu)會被稱為云原生超級計算的原因。
新的架構(gòu),新技術(shù)引入離不開技術(shù)人才的培養(yǎng)。從這個意義上說,每年的NVIDIA DPU 中國黑客松競賽,一來可以培育人才,二來也是最新技術(shù)應(yīng)用水平的體現(xiàn)。
據(jù)崔巖介紹,今年秋季 NVIDIA DPU 中國黑客松競賽的獲獎項目得到了評委會專家的認(rèn)可和推薦,無論技術(shù)水平,還是商業(yè)價值均大有潛力。
管中窺豹,新的架構(gòu)不僅帶來了技術(shù),更帶來了新的思路和希望。