AMD執(zhí)行副總裁及首席技術(shù)官 Mark Papermaster

來自Geekbench 5.4的基準測試數(shù)據(jù)顯示,Zen 5架構(gòu)指令分派率實現(xiàn)翻番至每周期8條指令,為算術(shù)邏輯單元(ALUs)引入統(tǒng)一調(diào)度程序以提高效率,執(zhí)行窗口至 40%,數(shù)據(jù)緩存增加50%以保持低延遲。

這些變化旨在更好地處理更大的指令集,并增強數(shù)據(jù)通過處理器的移動,特別是支持更大的矢量數(shù)據(jù)路徑和改進負載存儲操作,同時提高整體系統(tǒng)效率。當然,它們也都是眾所周知的微架構(gòu)設(shè)計中最重要的元素。

Zen 5架構(gòu)三大特點

Mark Papermaster總結(jié)出Zen 5架構(gòu)的三大特點:一是采用更快、更小和更低功耗的晶體管,優(yōu)化、節(jié)能和高性能,二是采用4nm甚至3nm領(lǐng)先制程技術(shù),增強型金屬堆,并繼續(xù)深化與臺積電合作;三是模塊化設(shè)計,可應(yīng)用到桌面、服務(wù)器、客戶端和嵌入式。

具體到產(chǎn)品層面,新一代的Zen 5架構(gòu)包括Zen 5、Zen 5 V-Cache和Zen 5c三種設(shè)計,涵蓋銳龍9000 系列臺式機處理器、帶有銳龍AI NPU功能的AMD 第三代移動平臺第三代以及面向服務(wù)器平臺的第五代EPYC(代號“Turin”),均提供4nm和3nm版本。

Zen 5架構(gòu)亮點令人矚目

一、革新異構(gòu)計算。

Mark Papermaster介紹說,Zen 5架構(gòu)創(chuàng)建了具有單個ISA實現(xiàn)的異構(gòu)CPU集群的新穎方法,此舉允許在不同的核心類型之間進行無縫的軟件優(yōu)化,代表著硬件和軟件創(chuàng)新相結(jié)合以實現(xiàn)最佳性能的重大進步。作為佐證,AMD與微軟強大而密切的合作證實了其高效的軟件調(diào)度能力,有效規(guī)避了在異構(gòu)實現(xiàn)時可能遇到的許多陷阱。

二、AI、游戲和內(nèi)容創(chuàng)作方面的重大改進。

IPC平均提升16%

IPC(Instructions Per Clock,每時鐘周期指令數(shù))提升是衡量處理器性能進步的一個重要標志。數(shù)據(jù)顯示,Zen 5架構(gòu)在各種工作負載上的IPC平均提升了16%,其中機器學習任務(wù)的單核代際提升高達32%,AES加密基準測試提高了35%。這些進步也展示了AVX-512和向量單元的強大功能。

三、深度協(xié)同優(yōu)化 IP設(shè)計,實現(xiàn)高性能和高效率。

與代工廠和各類合作伙伴的合作凸顯在持續(xù)優(yōu)化金屬堆棧以提高性能并降低電阻和電容,與鑄造廠進行的深度設(shè)計技術(shù)協(xié)同優(yōu)化,與合作伙伴改善電子設(shè)計自動化,在完整的內(nèi)核家族中使用一致的電路庫,并且還專注于模塊化配置方面更多的靈活性等方面。在Zen 5架構(gòu)上,這些合作再一次得到驗證。因此,即將亮相的Epic處理器中,這些優(yōu)化點將展現(xiàn)的淋漓盡致。

基于Zen 5架構(gòu)的若干骨干產(chǎn)品

首先來聊聊第五代 EPYC 處理器——“Turlin”,亮點是高性能和增強的安全功能。被譽為“史詩級”的“Turlin”Zen 5c頂配版提供192核心與384線程、384MB L3緩存,最高TDP達到了500W,而基于Zen 5架構(gòu)型號最多配備128核心與256線程,L3緩存為512MB,二者均提供4nm和3nm制程版本。

根據(jù)早些時候的信息,“Turin”至少提供20款采用Zen 5架構(gòu)內(nèi)核和Zen 5c架構(gòu)內(nèi)核的產(chǎn)品,均采用SP5插座。

安全是AMD始終關(guān)注的話題。“Turlin”繼續(xù)擴展了AMD在機密計算、Trusted IO(可信I/O)、數(shù)據(jù)安全、內(nèi)存加密、安全啟動和運行時保護等諸多領(lǐng)域的領(lǐng)導地位。

事實上,這些技術(shù)在第四代EPYC處理器中得到應(yīng)用。但Mark Papermaster特別強調(diào),可信IO可將數(shù)據(jù)保護從加密的CPU執(zhí)行擴展到存儲和加速器是一個非常關(guān)鍵的補充,尤其在AI時它變得更加重要,原因在于人們不僅擁有大量常規(guī)的數(shù)據(jù),而且還有比以往更需要保護的模型權(quán)重和訓練模型。

第五代EPYC處理器將于今年下半年亮相。畢竟不是“Turlin”的發(fā)布會,所以Mark Papermaster沒有透露更多的信息。

從第四代EPYC處理器開始,AMD發(fā)布聚焦電信及物聯(lián)網(wǎng)行業(yè)的9004系列Siena處理器,第五代以及未來EPYC是否會推出更多面向細分行業(yè)的處理器?針對筆者的好奇,被譽為“Zen架構(gòu)之父”的Mark Clark以“快了”兩個字回應(yīng)。

接下來是下一代Strix Point。Strix Point采用臺積電4nm工藝制造,TDP為45W,CPU部分包括了4個Zen 5架構(gòu)的大核心及8個Zen 5c架構(gòu)的小核心。

據(jù)介紹,Strix Point具有異構(gòu)設(shè)計的智能調(diào)度能力,作為緊急工作負載設(shè)計的新性能基礎(chǔ),具備兩個獨特的核心集群,一個針對峰值性能進行優(yōu)化,另一個針對吞吐量進行優(yōu)化,以此增強響應(yīng)性和效率的增強靈敏度。當然,二者都是相同的ISA實現(xiàn)。因此程序員再也無需考慮不同的核心集群,從優(yōu)化后的軟件角度,無論做什么工作都變得更加簡單。

關(guān)于代號為“Granite Ridge”的銳龍9000系列臺式機處理器,Mark Papermaster的此次演講中并未提及,筆者以后再做介紹。

Zen架構(gòu)家族處理器系列中的最新成員、核顯架構(gòu)RDNA 3.5。顯然,該架構(gòu)并非首次推出。憑借頂級性能、全新統(tǒng)一計算單元、更快的芯片互連、高速緩存技術(shù)和全新顯示及媒體引擎等特性共同作用,結(jié)合噪音抑制功能、Smart Access Memory技術(shù)、FreeSync Premium Pro等技術(shù)的應(yīng)用,不僅在游戲領(lǐng)域,在專業(yè)圖形處理和人工智能等領(lǐng)域也展現(xiàn)了AMD技術(shù)的領(lǐng)先地位。

移動端集顯和桌面端集顯的應(yīng)用瓶頸分別是功耗和內(nèi)存帶寬等。AMD與三星等移動合作伙伴深度合作,通過以下三大舉措來化解RDNA 3.5的能效瓶頸:一是優(yōu)化每瓦特性能,無論是最常見的紋理采樣操作子集對比普通游戲紋理操作,還是多數(shù)用于插值和豐富矢量ISA對比常見著色器中的操作,都實現(xiàn)了兩倍速率的提升;二是優(yōu)化每位性能,針對LP DDR 5內(nèi)存進行改進,使得訪問內(nèi)存的頻次更低但效率更高;三是專為更好的電池壽命設(shè)計,采取先進的GPU電源管理,最終實現(xiàn)RDNA 3.5在3D基準測試值(Timespy)提高了32%,DirectX基準測試(Night Raid)提高了19%,同時顯著降低了能耗。

嘆為觀止:第七代Zen技術(shù)已經(jīng)在路上

展示Zen架構(gòu)路線圖是備受AMD高管熱衷的操作,Mark Papermaster也不落“俗套”。他聲稱現(xiàn)在甚至已經(jīng)具備第七代Zen技術(shù)。即將亮相的Zen 6將會采取什么制程?你也許可以猜得到。

上述所有成功的原因被Mark Papermaster歸結(jié)于AMD與臺積電(TSMC)以及眾多技術(shù)合作伙伴關(guān)系的強大合作的基礎(chǔ)。

歷次發(fā)布會上,AMD都會把友商的解決方案拿出來進行對比,但是這一次他們幾乎沒有這樣做。筆者畫蛇添足,做出如下不成熟的判斷:在創(chuàng)新微架構(gòu)、大幅提升的IPC、能效優(yōu)化、安全性特性、制造工藝、核心數(shù)量和多線程、內(nèi)存和I/O支持、成本效益等方面,基于AMD Zen架構(gòu)推出的新產(chǎn)品已經(jīng)具備領(lǐng)先優(yōu)勢,但不斷擴大的生態(tài)系統(tǒng)和軟件優(yōu)化還需努力。

回顧7年前,當AMD推出Zen系列處理器時,吸引了業(yè)界許多人,他們與AMD一起同行至今。

“畢竟,這不僅僅是一個單一的產(chǎn)品,而是一個處理器家族?!盡ark Papermaster表示,Zen 5架構(gòu)帶來的改進不會讓市場失望,它代表著一次巨大的飛躍,也勢必成為未來幾代人的一個基座;AMD也將始終如一地按照既定目標向前進,為x86處理器帶來更多性能。

分享到

xiesc

相關(guān)推薦