本次MLPerf? 評測吸引了包括NVIDIA、浪潮信息、Intel、高通、阿里巴巴、戴爾、壁仞等全球21家廠商和研究機(jī)構(gòu)參與,共提交超10000項(xiàng)評測成績。

在本次倍受矚目的數(shù)據(jù)中心BERT評測任務(wù)中,浪潮AI服務(wù)器突破性地全球首次實(shí)現(xiàn)單機(jī)搭載24顆國際通用GPU,通過深入優(yōu)化GPU輪詢調(diào)度策略,充分發(fā)揮每塊GPU性能,大幅提升了BERT推理性能,最終實(shí)現(xiàn)每秒鐘回答7.5萬個問答任務(wù),相較于上次評測最佳成績提升達(dá)93.81%,這也是浪潮AI服務(wù)器第4次獲得MLPerf?推理BERT任務(wù)性能冠軍。

同時引人注目的是,在本次MLPerf評測中,浪潮AI服務(wù)器成功搭載國產(chǎn)GPU芯片廠商壁仞科技自研的高端通用GPU,在BERT和ResNet50兩項(xiàng)重要任務(wù)中取得了8卡和4卡整機(jī)的全球最佳性能,實(shí)現(xiàn)了國產(chǎn)芯片在國際AI賽場上的精彩亮相,并取得歷史性突破。

自MLPerf?發(fā)起至今,浪潮信息持續(xù)積極推動AI基準(zhǔn)評測發(fā)展創(chuàng)新,先后10次參與評測,多次獲得冠軍總數(shù)第一。浪潮信息在AI服務(wù)器的整機(jī)系統(tǒng)優(yōu)化、軟硬件協(xié)同優(yōu)化等多方面持續(xù)創(chuàng)新,不斷打破性能記錄,并將領(lǐng)先技術(shù)分享到MLCommons社區(qū),被大量參賽廠商采用并廣泛應(yīng)用于后續(xù)評測中。

在算法優(yōu)化層面,浪潮首先在MLPerf訓(xùn)練中應(yīng)用超參優(yōu)化方案,大幅提高訓(xùn)練性能。浪潮開創(chuàng)性提出ResNet 收斂性優(yōu)化方案,在ImageNet數(shù)據(jù)集上,僅使用85%的原迭代步數(shù)就達(dá)到了目標(biāo)精度,將MLPerf訓(xùn)練性能記錄提升了15%;率先在MLPerf推理中使用自研卷積合并算法的plugin算子方案,優(yōu)化后算法性能從原算法123TOPS提升到141TOPS,性能提升達(dá)14.6%。

在架構(gòu)優(yōu)化方面,浪潮率先采用JBOG方案,極大提升了AI服務(wù)器搭載超多數(shù)量GPU設(shè)備的能力。本次評測中,浪潮NF5468M6J產(chǎn)品突破性地實(shí)現(xiàn)了單機(jī)搭載24顆GPU。同時,浪潮針對高負(fù)載多GPU協(xié)同任務(wù)調(diào)度以及NUMA節(jié)點(diǎn)與GPU之間的數(shù)據(jù)傳輸性能進(jìn)行了深度優(yōu)化,實(shí)現(xiàn)了CPU和GPU的利用率線性擴(kuò)展、多個任務(wù)并發(fā)場景同步運(yùn)行,大幅提升性能。

浪潮信息是全球領(lǐng)先的AI計(jì)算廠商,AI服務(wù)器市場份額全球第一,連續(xù)五年中國市場份額超過50%。浪潮信息致力于AI計(jì)算平臺、資源平臺和算法平臺的全棧創(chuàng)新,并通過元腦生態(tài)攜手領(lǐng)先伙伴共同加速AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化進(jìn)程。

MLPerf??

MLPerf? 是影響力最廣的國際AI性能基準(zhǔn)評測,由圖靈獎得主大衛(wèi)?帕特森(David Patterson)聯(lián)合頂尖學(xué)術(shù)機(jī)構(gòu)發(fā)起成立。2020年,非盈利性機(jī)器學(xué)習(xí)開放組織MLCommons基于MLPerf? 基準(zhǔn)測試成立,其成員包括Google、Facebook、NVIDIA、英特爾、浪潮信息、哈佛大學(xué)、斯坦福大學(xué)、加州大學(xué)伯克利分校等50余家全球AI領(lǐng)軍企業(yè)及頂尖學(xué)術(shù)機(jī)構(gòu),致力于推進(jìn)機(jī)器學(xué)習(xí)和人工智能標(biāo)準(zhǔn)及衡量指標(biāo)。目前,MLCommons每年組織2次MLPerf? AI訓(xùn)練性能測試和2次MLPerf? AI推理性能測試,以便快速跟進(jìn)迅速變化的計(jì)算需求和計(jì)算性能提升,為用戶衡量設(shè)備性能提供權(quán)威有效的數(shù)據(jù)指導(dǎo)。

分享到

xiesc

相關(guān)推薦