亚洲国产成人字幕久久,777精品一区二区三区,中文字幕无码乱码人妻系列蜜桃

概覽：

AMD 已超額完成其30×25目標(biāo)，將AI訓(xùn)練和HPC計(jì)算的節(jié)點(diǎn)級(jí)能效提升了38倍，與五年前的系統(tǒng)相比，相當(dāng)于同等性能下能耗降低97%。
AMD 設(shè)定了新的2030年目標(biāo)，即以2024年為基準(zhǔn)，將機(jī)架級(jí)能效提升20倍，使目前需要超過275個(gè)機(jī)架的典型AI模型到2030年只需在一個(gè)機(jī)架內(nèi)即可完成訓(xùn)練，耗電量減少95%。
結(jié)合軟件和算法方面的進(jìn)步，新的目標(biāo)可使整體能效提升高達(dá)100倍。

在AMD，能效一直是我們路線圖和產(chǎn)品戰(zhàn)略中的核心設(shè)計(jì)指導(dǎo)原則。十多年來，我們制定了公開、有時(shí)限的目標(biāo)，以大幅提升產(chǎn)品的能效，并始終如一地實(shí)現(xiàn)并超越這些目標(biāo)。今天，我很自豪地宣布，我們?cè)俅巫龅搅?，并正在制定下一個(gè)五年節(jié)能設(shè)計(jì)的愿景。

在今天的Advancing AI上，我們宣布AMD已經(jīng)超越了在2021年制定的30×25目標(biāo)，即從2020年到2025年將AI訓(xùn)練和高性能計(jì)算（HPC）節(jié)點(diǎn)的能效提高30倍。這是一個(gè)雄心勃勃的目標(biāo)，我們很自豪能夠超額完成它，但我們不會(huì)止步于此。

隨著人工智能規(guī)模的不斷擴(kuò)大，以及我們邁向真正端到端的全AI系統(tǒng)設(shè)計(jì)，我們比以往任何時(shí)候都更需要繼續(xù)保持在節(jié)能設(shè)計(jì)領(lǐng)域的領(lǐng)先地位。正因?yàn)榇耍覀兘裉煲矊⒛抗馔断蛞粋€(gè)大膽的新目標(biāo)：以2024年為基準(zhǔn)，到2030年，將用于AI訓(xùn)練和推理的機(jī)架級(jí)能效提升20倍。

在十年領(lǐng)先地位的基礎(chǔ)上再接再厲

這標(biāo)志著我們?cè)跀?shù)十年間致力于提高整個(gè)計(jì)算平臺(tái)能效的第三個(gè)重要里程碑。2020年，我們超額實(shí)現(xiàn)了25×20的目標(biāo)，在短短六年內(nèi)將AMD移動(dòng)處理器的能效提高了25倍。在此勢(shì)頭之上，便是針對(duì)加速節(jié)點(diǎn)中AI和HPC工作負(fù)載的30×25目標(biāo)。如今，到2030年實(shí)現(xiàn)機(jī)架級(jí)20倍能效提升的目標(biāo)反映了下一個(gè)前沿領(lǐng)域，不僅著眼于芯片，還關(guān)注更智能和更高效的系統(tǒng)，從芯片到整機(jī)架集成，以滿足數(shù)據(jù)中心級(jí)別的電力需求。

超越 30×25

我們的30×25目標(biāo)源自于一個(gè)明確的基準(zhǔn)，即與2020年基準(zhǔn)年相比，將加速計(jì)算節(jié)點(diǎn)的能效提升30倍。這一目標(biāo)意味著，與過去五年（2015-2020年）的行業(yè)趨勢(shì)相比，能效提升2.5倍以上。截至 2025 年中，我們已超越這一目標(biāo)，在四塊AMD Instinct GPU和一顆第五代AMD EPYC CPU的當(dāng)前配置下，相較基準(zhǔn)系統(tǒng)實(shí)現(xiàn)38倍的能效提升。與五年前的系統(tǒng)相比，這相當(dāng)于在相同性能下能耗降低97%。

我們通過深度架構(gòu)創(chuàng)新、積極優(yōu)化每瓦性能以及對(duì)CPU和GPU產(chǎn)品線進(jìn)行不懈的工程設(shè)計(jì)實(shí)現(xiàn)了這一目標(biāo)。

AI時(shí)代的新目標(biāo)

隨著工作負(fù)載規(guī)模和需求的持續(xù)增長(zhǎng)，節(jié)點(diǎn)級(jí)效率提升將無法跟上步伐。最顯著的效率影響可以在系統(tǒng)級(jí)實(shí)現(xiàn)，而這正是我們2030年目標(biāo)的重點(diǎn)。

我們相信，從2024年到2030年，我們可以將AI訓(xùn)練和推理的機(jī)架級(jí)能效提升20倍。AMD 估計(jì)，這將比2018年至2025年的行業(yè)提升趨勢(shì)高出近3倍。根據(jù)我們最新的設(shè)計(jì)和路線圖預(yù)測(cè)，這反映了整個(gè)機(jī)架的每瓦性能提升，包括 CPU、GPU、內(nèi)存、網(wǎng)絡(luò)、存儲(chǔ)和軟硬件協(xié)同設(shè)計(jì)。這種從節(jié)點(diǎn)到機(jī)架的轉(zhuǎn)變得益于我們快速發(fā)展的端到端AI戰(zhàn)略，也是以更可持續(xù)的方式擴(kuò)展數(shù)據(jù)中心AI的關(guān)鍵。

實(shí)踐中的意義

機(jī)架級(jí)效率提升20倍，幾乎是之前行業(yè)效率提升率的3倍，意義重大。以2025年典型AI模型的訓(xùn)練為基準(zhǔn)，這些提升可以實(shí)現(xiàn)：

?將機(jī)架數(shù)量從超過275個(gè)整合到少于1個(gè)已充分利用的機(jī)架

?運(yùn)營(yíng)用電量減少95%以上

?模型訓(xùn)練產(chǎn)生的碳排放量從約3000公噸二氧化碳減少到100公噸二氧化碳

這些預(yù)測(cè)基于AMD芯片和系統(tǒng)設(shè)計(jì)路線圖以及能效專家Jonathan Koomey博士驗(yàn)證的測(cè)量方法。

Koomey 博士表示：“通過將2030年目標(biāo)建立在系統(tǒng)級(jí)指標(biāo)和透明方法的基礎(chǔ)上，AMD正在提高行業(yè)標(biāo)準(zhǔn)。機(jī)架級(jí)效率的目標(biāo)提升將使生態(tài)系統(tǒng)中的其他各方，從模型開發(fā)者到云服務(wù)提供商，更能夠可持續(xù)、更具成本效益地?cái)U(kuò)展AI計(jì)算。”

放眼硬件之外

我們的20倍目標(biāo)體現(xiàn)了我們直接掌控的領(lǐng)域——硬件和系統(tǒng)級(jí)設(shè)計(jì)。但我們知道，隨著軟件開發(fā)人員不斷探索更智能的算法，并以目前的速度繼續(xù)使用低精度方法進(jìn)行創(chuàng)新，AI模型的效率將有可能實(shí)現(xiàn)更大提升，在目標(biāo)期內(nèi)最高可達(dá)5倍。將這些因素納入考量，到2030年，典型AI模型訓(xùn)練的整體能效將提升100倍。

雖然 AMD 并未宣稱在我們自己的目標(biāo)中已實(shí)現(xiàn)如此高的倍增，但我們很自豪能夠提供實(shí)現(xiàn)這一目標(biāo)的硬件基礎(chǔ)，并支持致力于實(shí)現(xiàn)這些提升的開放生態(tài)系統(tǒng)和開發(fā)者社區(qū)以實(shí)現(xiàn)這些收益。無論是通過開放標(biāo)準(zhǔn)、AMD ROCm的開放軟件方案，還是與合作伙伴的密切合作，AMD 始終致力于幫助世界各地的創(chuàng)新者更高效地?cái)U(kuò)展AI規(guī)模。

下一步行動(dòng)

我們以30×25為上一個(gè)篇章畫上句號(hào)，并以全新的機(jī)架級(jí)目標(biāo)開啟下一章，我們將繼續(xù)致力于透明、責(zé)任義務(wù)和可衡量的進(jìn)展。這種方式使AMD脫穎而出，而且對(duì)于我們?nèi)绾卧贏I需求和部署不斷擴(kuò)展的背景下推動(dòng)行業(yè)效率提升也必不可少。

我們很高興能夠不斷挑戰(zhàn)極限，不僅僅是性能的極限，還有以效率為主導(dǎo)的無限可能。隨著目標(biāo)的推進(jìn)，我們將繼續(xù)分享進(jìn)展情況以及這些成果對(duì)整個(gè)生態(tài)系統(tǒng)產(chǎn)生的影響。

【本文作者Samuel Naffziger, AMD高級(jí)副總裁兼企業(yè)院士】

分享到

AMD 能效目標(biāo)

xiesc

相關(guān)推薦

近期文章

熱門標(biāo)簽