浪潮NF5488A5創(chuàng)造18項MLPerf推理性能紀(jì)錄
性能大幅提升3倍,全棧AI能力優(yōu)勢凸顯
在此次基準(zhǔn)測試中,浪潮AI服務(wù)器NF5488A5在開放優(yōu)化(Open)和固定任務(wù)(Closed)的ResNet50基準(zhǔn)性能測試中,均表現(xiàn)優(yōu)異,相比2019年MLPerf推理榜單的服務(wù)器最好性能提升高達(dá)3倍。
MLPerf ResNet50推理性能2019 VS 2020對比
NF5488A5是浪潮自研的新一代AI服務(wù)器,是此次MLPerf全球競賽中唯一可以在4U空間內(nèi)支持8塊安培架構(gòu)A100芯片實現(xiàn)NVLink高速互聯(lián)的AI服務(wù)器。浪潮NF5488A5在系統(tǒng)拓?fù)渖喜捎昧顺脱舆t設(shè)計,支持PCIe 4.0全鏈路極致優(yōu)化,高頻通信單元采用一級拓?fù)渥罱B接,最大限度提升處理器到AI芯片間的通信性能。同時,通過配置NUMA節(jié)點,確保每顆處理器與其直連的GPU之間通信性能最優(yōu),最大限度降低通信延遲。此外,NF5488A5通過深度優(yōu)化系統(tǒng)結(jié)構(gòu)設(shè)計,確保設(shè)備可在高溫環(huán)境下穩(wěn)定運(yùn)行。
本次基準(zhǔn)測試中,浪潮展示出了卓越的AI計算軟硬件協(xié)同優(yōu)化能力。在硬件層面,通過對CPU、GPU硬件性能的精細(xì)校準(zhǔn)和全面優(yōu)化,使CPU性能、GPU性能、CPU與GPU之間的數(shù)據(jù)通路均處于對AI推理最優(yōu)狀態(tài);在軟件層面,結(jié)合GPU硬件拓?fù)鋵Χ郍PU的輪詢調(diào)度優(yōu)化使單卡至多卡性能達(dá)到了近似線性擴(kuò)展;在深度學(xué)習(xí)算法層面,結(jié)合GPU Tensor Core 單元的計算特征,通過自研通道壓縮算法成功實現(xiàn)了模型的極致性能優(yōu)化,在精度無損的情況下性能提升近2倍。
各服務(wù)器MLPerf AI推理性能對比(以浪潮NF5488A5為基準(zhǔn),越高越好)
浪潮是全球領(lǐng)先的AI計算領(lǐng)導(dǎo)廠商,其AI服務(wù)器在中國的市場份額已連續(xù)三年保持在50%以上。浪潮致力于AI計算平臺、資源平臺和算法平臺的研發(fā)創(chuàng)新,并通過元腦生態(tài)與AI領(lǐng)先企業(yè)共同推進(jìn)AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化進(jìn)程。