概覽:

在AMD,能效一直是我們路線圖和產(chǎn)品戰(zhàn)略中的核心設(shè)計(jì)指導(dǎo)原則。十多年來,我們制定了公開、有時(shí)限的目標(biāo),以大幅提升產(chǎn)品的能效,并始終如一地實(shí)現(xiàn)并超越這些目標(biāo)。今天,我很自豪地宣布,我們?cè)俅巫龅搅?,并正在制定下一個(gè)五年節(jié)能設(shè)計(jì)的愿景。

在今天的Advancing AI上,我們宣布AMD已經(jīng)超越了在2021年制定的30×25目標(biāo),即從2020年到2025年將AI訓(xùn)練和高性能計(jì)算(HPC)節(jié)點(diǎn)的能效提高30倍。這是一個(gè)雄心勃勃的目標(biāo),我們很自豪能夠超額完成它,但我們不會(huì)止步于此。

隨著人工智能規(guī)模的不斷擴(kuò)大,以及我們邁向真正端到端的全AI系統(tǒng)設(shè)計(jì),我們比以往任何時(shí)候都更需要繼續(xù)保持在節(jié)能設(shè)計(jì)領(lǐng)域的領(lǐng)先地位。正因?yàn)榇?,我們今天也將目光投向一個(gè)大膽的新目標(biāo):以2024年為基準(zhǔn),到2030年,將用于AI訓(xùn)練和推理的機(jī)架級(jí)能效提升20倍。

在十年領(lǐng)先地位的基礎(chǔ)上再接再厲

這標(biāo)志著我們?cè)跀?shù)十年間致力于提高整個(gè)計(jì)算平臺(tái)能效的第三個(gè)重要里程碑。2020年,我們超額實(shí)現(xiàn)了25×20的目標(biāo),在短短六年內(nèi)將AMD移動(dòng)處理器的能效提高了25倍。在此勢(shì)頭之上,便是針對(duì)加速節(jié)點(diǎn)中AI和HPC工作負(fù)載的30×25目標(biāo)。如今,到2030年實(shí)現(xiàn)機(jī)架級(jí)20倍能效提升的目標(biāo)反映了下一個(gè)前沿領(lǐng)域,不僅著眼于芯片,還關(guān)注更智能和更高效的系統(tǒng),從芯片到整機(jī)架集成,以滿足數(shù)據(jù)中心級(jí)別的電力需求。

超越 30×25

我們的30×25目標(biāo)源自于一個(gè)明確的基準(zhǔn),即與2020年基準(zhǔn)年相比,將加速計(jì)算節(jié)點(diǎn)的能效提升30倍。這一目標(biāo)意味著,與過去五年(2015-2020年)的行業(yè)趨勢(shì)相比,能效提升2.5倍以上。截至 2025 年中,我們已超越這一目標(biāo),在四塊AMD Instinct GPU和一顆第五代AMD EPYC CPU的當(dāng)前配置下,相較基準(zhǔn)系統(tǒng)實(shí)現(xiàn)38倍的能效提升。與五年前的系統(tǒng)相比,這相當(dāng)于在相同性能下能耗降低97%。

我們通過深度架構(gòu)創(chuàng)新、積極優(yōu)化每瓦性能以及對(duì)CPU和GPU產(chǎn)品線進(jìn)行不懈的工程設(shè)計(jì)實(shí)現(xiàn)了這一目標(biāo)。

AI時(shí)代的新目標(biāo)

隨著工作負(fù)載規(guī)模和需求的持續(xù)增長(zhǎng),節(jié)點(diǎn)級(jí)效率提升將無法跟上步伐。最顯著的效率影響可以在系統(tǒng)級(jí)實(shí)現(xiàn),而這正是我們2030年目標(biāo)的重點(diǎn)。

我們相信,從2024年到2030年,我們可以將AI訓(xùn)練和推理的機(jī)架級(jí)能效提升20倍。AMD 估計(jì),這將比2018年至2025年的行業(yè)提升趨勢(shì)高出近3倍。根據(jù)我們最新的設(shè)計(jì)和路線圖預(yù)測(cè),這反映了整個(gè)機(jī)架的每瓦性能提升,包括 CPU、GPU、內(nèi)存、網(wǎng)絡(luò)、存儲(chǔ)和軟硬件協(xié)同設(shè)計(jì)。這種從節(jié)點(diǎn)到機(jī)架的轉(zhuǎn)變得益于我們快速發(fā)展的端到端AI戰(zhàn)略,也是以更可持續(xù)的方式擴(kuò)展數(shù)據(jù)中心AI的關(guān)鍵。

實(shí)踐中的意義

機(jī)架級(jí)效率提升20倍,幾乎是之前行業(yè)效率提升率的3倍,意義重大。以2025年典型AI模型的訓(xùn)練為基準(zhǔn),這些提升可以實(shí)現(xiàn):

?將機(jī)架數(shù)量從超過275個(gè)整合到少于1個(gè)已充分利用的機(jī)架

?運(yùn)營(yíng)用電量減少95%以上

?模型訓(xùn)練產(chǎn)生的碳排放量從約3000公噸二氧化碳減少到100公噸二氧化碳

這些預(yù)測(cè)基于AMD芯片和系統(tǒng)設(shè)計(jì)路線圖以及能效專家Jonathan Koomey博士驗(yàn)證的測(cè)量方法。

Koomey 博士表示:“通過將2030年目標(biāo)建立在系統(tǒng)級(jí)指標(biāo)和透明方法的基礎(chǔ)上,AMD正在提高行業(yè)標(biāo)準(zhǔn)。機(jī)架級(jí)效率的目標(biāo)提升將使生態(tài)系統(tǒng)中的其他各方,從模型開發(fā)者到云服務(wù)提供商,更能夠可持續(xù)、更具成本效益地?cái)U(kuò)展AI計(jì)算?!?/p>

放眼硬件之外

我們的20倍目標(biāo)體現(xiàn)了我們直接掌控的領(lǐng)域——硬件和系統(tǒng)級(jí)設(shè)計(jì)。但我們知道,隨著軟件開發(fā)人員不斷探索更智能的算法,并以目前的速度繼續(xù)使用低精度方法進(jìn)行創(chuàng)新,AI模型的效率將有可能實(shí)現(xiàn)更大提升,在目標(biāo)期內(nèi)最高可達(dá)5倍。將這些因素納入考量,到2030年,典型AI模型訓(xùn)練的整體能效將提升100倍。

雖然 AMD 并未宣稱在我們自己的目標(biāo)中已實(shí)現(xiàn)如此高的倍增,但我們很自豪能夠提供實(shí)現(xiàn)這一目標(biāo)的硬件基礎(chǔ),并支持致力于實(shí)現(xiàn)這些提升的開放生態(tài)系統(tǒng)和開發(fā)者社區(qū)以實(shí)現(xiàn)這些收益。無論是通過開放標(biāo)準(zhǔn)、AMD ROCm的開放軟件方案,還是與合作伙伴的密切合作,AMD 始終致力于幫助世界各地的創(chuàng)新者更高效地?cái)U(kuò)展AI規(guī)模。

下一步行動(dòng)

我們以30×25為上一個(gè)篇章畫上句號(hào),并以全新的機(jī)架級(jí)目標(biāo)開啟下一章,我們將繼續(xù)致力于透明、責(zé)任義務(wù)和可衡量的進(jìn)展。這種方式使AMD脫穎而出,而且對(duì)于我們?nèi)绾卧贏I需求和部署不斷擴(kuò)展的背景下推動(dòng)行業(yè)效率提升也必不可少。

我們很高興能夠不斷挑戰(zhàn)極限,不僅僅是性能的極限,還有以效率為主導(dǎo)的無限可能。隨著目標(biāo)的推進(jìn),我們將繼續(xù)分享進(jìn)展情況以及這些成果對(duì)整個(gè)生態(tài)系統(tǒng)產(chǎn)生的影響。

【本文作者Samuel Naffziger, AMD高級(jí)副總裁兼企業(yè)院士】

分享到

xiesc

相關(guān)推薦