六年過(guò)去,歷經(jīng)全球疫情和經(jīng)濟(jì)持續(xù)動(dòng)蕩局勢(shì),AMD的產(chǎn)品線之路越拓越寬。
“這張幻燈片上透露了兩個(gè)關(guān)鍵信息,一是我們按時(shí)交付了所有的產(chǎn)品,二是每一個(gè)產(chǎn)品都提高了性能?!?6月13日,在舊金山召開(kāi)的 “數(shù)據(jù)中心和人工智能技術(shù)首映式(Data Center and Al Technology Premiere)”上,AMD數(shù)據(jù)中心解決方案集團(tuán)公司副總裁Ram Peddibhotla指著這張路線圖說(shuō):“準(zhǔn)時(shí)交貨和高性能的結(jié)合,為我們的客戶帶來(lái)了巨大的價(jià)值?!?/p>
開(kāi)疆拓土的AMD EPYC處理器
從AMD EPYC處理器產(chǎn)品路線圖可以看出,“重返江湖”后AMD先后推出的前兩代EPYC處理器Naples、Rome都是單項(xiàng)產(chǎn)品,到了2021年3月,AMD第三代EPYC 處理器Milan開(kāi)始“衍生”出了它的兄弟產(chǎn)品Milan-X——最大的革新是采用了名為3D V-Cache堆疊緩存的技術(shù);2022年11月,第四代EPYC 處理器Genoa正式問(wèn)世,半年后的今天,Genoa-X 、Bergamo亮相,另一款產(chǎn)品Siena也將于年內(nèi)推出。
目不暇給的產(chǎn)品發(fā)布背后是這樣的一個(gè)事實(shí):從第三代EPYC處理器開(kāi)始,AMD不再是以一個(gè)CPU包打天下,第四代EPYC處理器更是根據(jù)市場(chǎng)做了細(xì)分,除了保持傳統(tǒng)優(yōu)勢(shì)的通用型產(chǎn)品,還針對(duì)云原生應(yīng)用、計(jì)算技術(shù)以及面向電信與邊緣端演繹拓展,產(chǎn)品家族越來(lái)越豐富的同時(shí),為客戶需求提供更加精準(zhǔn)的解決方案和服務(wù)。
此舉無(wú)疑受到了合作伙伴和客戶的歡迎。
6月13日,出席Data Center and Al Technology Premiere的戴爾投資組合管理和戰(zhàn)略主管Shekhar Mishra介紹說(shuō),戴爾是致力于把最好的解決方案給到客戶,幫助他們更好地拓展業(yè)務(wù);AMD提供了具有高性?xún)r(jià)比、高能效而且有非常理想的核心數(shù)量的優(yōu)秀的解決方案,對(duì)那些已經(jīng)應(yīng)用戴爾及AMD產(chǎn)品的客戶而言,理論上無(wú)需花精力去升級(jí)更換系統(tǒng)和平臺(tái),大大降低了各方面的成本。
此前,戴爾已經(jīng)基于AMD EPYC處理器 Genoa,發(fā)布了面向虛擬化、NFV和HCI的計(jì)算密度型服務(wù)器PowerEdge R6515 &R6615,面向密集虛擬環(huán)境和VDI提供靈活性和高性能的PowerEdge R6525 &R6625服務(wù)器,面向數(shù)字制造、研究和網(wǎng)絡(luò)技術(shù)等HPC密集計(jì)算環(huán)境的PowerEdge C6525,用于數(shù)據(jù)數(shù)據(jù)處理、虛擬化和SDS,具有可擴(kuò)展性和靈活性的PowerEdge R7515&R7615服務(wù)器,面向全閃存SDS、VDI和數(shù)據(jù)分析型,具有大規(guī)模可擴(kuò)展性的PowerEdge R7525 & R7625,以及用于AI/ML和HPC的一體化服務(wù)器PowerEdge XE8545。
與針對(duì)云原生工作負(fù)載優(yōu)化的Bergamo處理器的發(fā)布同步,戴爾上述所有產(chǎn)品線中,除了PowerEdge XE8545之外全部進(jìn)行了升級(jí),為雙方共同的客戶加速向云轉(zhuǎn)型提供支撐。
合作伙伴的站臺(tái),讓AMD的EPYC服務(wù)器策略“昭告天下”。Ram Peddibhotla 告訴媒體:“我們的服務(wù)器策略有三項(xiàng)內(nèi)容,一是提供世界上性能最高的通用數(shù)據(jù)中心CPU,二是針對(duì)各種工作負(fù)載提供優(yōu)化的芯片解決方案,三是建立和完善全系列的產(chǎn)品解決方案與生態(tài)系統(tǒng),和合作伙伴一起加速價(jià)值實(shí)現(xiàn)。”
1.支持EPYC服務(wù)器策略的Chiplet架構(gòu)
Ram Peddibhotla表示,支持AMD的EPYC服務(wù)器策略的是AMD具有行業(yè)領(lǐng)先地位的小芯片(Chiplet)架構(gòu),其特性是超越摩爾定律,模塊化、可配置設(shè)計(jì),領(lǐng)先的工藝節(jié)點(diǎn),先進(jìn)的包裝3D堆疊技術(shù),可加速性能提升、降低電力和成本效率。
2.Genoa發(fā)布已半年,仍然可圈可點(diǎn)
回顧去年發(fā)布的Genoa,他滿滿的溢美之詞:基于小芯片打造的EPYC第四代處理器,是最快的通用數(shù)據(jù)中心處理器——能源效率極高,具有領(lǐng)導(dǎo)跨工作負(fù)載和行業(yè)的TCO,強(qiáng)大的安全性為機(jī)密計(jì)算提供動(dòng)力,亦具備豐富的解決方案生態(tài)系統(tǒng)——因此,EPYC第四代處理器Genoa “是世界上最好的數(shù)據(jù)中心CPU”。
64核的AMD EPYC 第三代處理器7763發(fā)布時(shí),對(duì)標(biāo)的是當(dāng)時(shí)英特爾最優(yōu)的至強(qiáng)8490H處理器,二者的指標(biāo)已經(jīng)幾乎并駕齊驅(qū);此次發(fā)布的94核AMD EPYC 9654處理器,領(lǐng)先度已經(jīng)遠(yuǎn)遠(yuǎn)超出該款至強(qiáng)處理器。
“你看,無(wú)論是運(yùn)行JAVA還是SAP,事實(shí)上EPYC第四代 9654處理器的性能是非常有優(yōu)勢(shì)的?!迸R時(shí)客串翻譯工作的中國(guó)市場(chǎng)總監(jiān)Linda覺(jué)得她的低調(diào)用詞不夠忠實(shí)于原意,趕緊更正:“抱歉,這個(gè)應(yīng)該是遙遙領(lǐng)先!”
在體現(xiàn)云計(jì)算效能的2P SPECrate 2017_int base / CPU 1Ku $ 基準(zhǔn)測(cè)試中,第四代EPYC 9654的成績(jī)?yōu)?800分,遠(yuǎn)超英特爾至強(qiáng)8490H處理器的1000分,第三代EPYC7763的成績(jī)?yōu)?61分,效能提高了107%。換句話說(shuō),EPYC 9654以不到一半的成本,收獲了同樣的性能,相當(dāng)于每美元的性能比高出158%。
因此,在云經(jīng)濟(jì)效益方面, AMD EPYC 處理器以更小的投資實(shí)現(xiàn)了更大的回報(bào)。
在體現(xiàn)高性能計(jì)算能力的SPECrate_2017_fp_base基準(zhǔn)測(cè)試中,EPYC9654的成績(jī)?yōu)?480分,比第三代EPYC7763的663分提升了123%的性能。
“鑒于第三代EPYC已經(jīng)獲得了服務(wù)器處理器市場(chǎng)中的性能領(lǐng)先地位,第四代EPYC相對(duì)第三代進(jìn)一步倍增的性能,將進(jìn)一步強(qiáng)化AMD在服務(wù)器領(lǐng)域的影響力。”Ram Peddibhotla信心滿滿地說(shuō)。
簡(jiǎn)言之,Genoa是適用于所有通用計(jì)算的一款處理器,從虛擬到集成,從軟件、網(wǎng)絡(luò),到基礎(chǔ)測(cè)試、數(shù)據(jù)分析等,都提供高度融合的支持。
3.面向云原生應(yīng)用的“Bergamo”
云原生,就是基于云平臺(tái)定制開(kāi)發(fā)的計(jì)算性能。Bergamo處理器提供了可擴(kuò)展性、靈活性、抗壓性、速度、可視化,支持建模、簡(jiǎn)化部署和管理。
通常情況下,一個(gè)大型傳統(tǒng)的大型應(yīng)用系統(tǒng),開(kāi)發(fā)周期長(zhǎng)、投資成本高、應(yīng)用時(shí)間久、迭代更新慢、運(yùn)算的時(shí)間也很長(zhǎng)。而基于云環(huán)境的應(yīng)用程序是一次編寫(xiě)、隨時(shí)隨地運(yùn)行。在云計(jì)算模式下,一個(gè)大的程序可以分解為成百上千個(gè)函數(shù)在運(yùn)行,甚至毫秒之內(nèi)就可以完成SOC上的計(jì)算,相應(yīng)地,開(kāi)發(fā)人員也可以快速地更改模塊的不同部分,更新迭代方便。
大型應(yīng)用程序需要借助大量緩存進(jìn)行數(shù)據(jù)共享,而云計(jì)算則是另一個(gè)極端——由于函數(shù)之間的數(shù)據(jù)局部性很小,所以緩存并不能顯示優(yōu)勢(shì),也就是說(shuō),云環(huán)境下處理器的三級(jí)緩存重要性極度下滑,取而代之的是軟件的兼容性:以科學(xué)的創(chuàng)新取代艱難的遷移。
EPYC 97X4系列三個(gè)版本:9754、9754S、9734,核心從112到128個(gè),三級(jí)緩存均為256MB。其中9754S的 SMT可以配置,這是為了給客戶提供更好的靈活性——當(dāng)然,SMT打開(kāi)后性能會(huì)更好。
數(shù)據(jù)顯示,開(kāi)啟SMT配置,總體擁有成本可以節(jié)省約9%。
那為什么有些用戶要把SMT關(guān)掉呢?
“這是因?yàn)樗M玫揭粋€(gè)單線程最高的性能。這種情況下,他才會(huì)去關(guān)掉SMT。當(dāng)然,我們?cè)试S他關(guān)掉?!?AMD公司副總裁Robert Hormuth解釋說(shuō)。
EPYC 9754為什么能適用于各種云原生工作負(fù)載?經(jīng)過(guò)NGINX、Redis 、Cassandra-test、Memcached、FFmpeg、MySQL TPROC-C、Server-side Java Max等平臺(tái)運(yùn)行測(cè)試,EPYC 9754與Ampere Altra和英特爾至強(qiáng)8490相對(duì)比,平均吞吐量性能提升2.9倍,比擅長(zhǎng)于云數(shù)據(jù)中心處理器的Ampere高出3.7倍。
如果要實(shí)現(xiàn)每秒處理3.75億的實(shí)時(shí)需求,與128核的1P Ampere Altra相比,同核數(shù)的1P AMDEPYC 9754可以節(jié)省55%的服務(wù)器數(shù)量,年度節(jié)省39%的耗電量、39%的運(yùn)營(yíng)成本,最終減少19%的總體擁有成本。
4.加載3D V-Cache技術(shù) 的“Genoa-X”
Genoa-X是加載了3D V-Cache技術(shù)的第四代的EPYC處理器 ,它采用 5nm制程工藝節(jié)點(diǎn)、高性能“Zen 4”內(nèi)核,高達(dá)1.1GB的三級(jí)緩存容量,以及AMD Infinity 、Guard安全性和豐富的解決方案生態(tài)系統(tǒng),以世界上技術(shù)計(jì)算最高性能的x86服務(wù)器處理器支持有限元分析、結(jié)構(gòu)分析、電子設(shè)計(jì)自動(dòng)化、計(jì)算流體動(dòng)力學(xué)。
“加載了AMD 3D V-Cache技術(shù)的Genoa-X包括三個(gè)產(chǎn)品,16核心的EPYC 9184X支持電子設(shè)計(jì)自動(dòng)化相關(guān)的計(jì)算, 32核和96核的EPYC 9384X和EPYC 9684X主要支持計(jì)算流體動(dòng)力學(xué)、有限元分析和結(jié)構(gòu)分析?!?AMD公司副總裁Robert Hormuth 介紹說(shuō)。
同等環(huán)境下,運(yùn)行SYNOPSYS VCS,采用AMD 3D V-Cache技術(shù)的第四代EPYC ,其RTL驗(yàn)證速度比沒(méi)有采用AMD 3D V-Cache技術(shù)的第四代EPYC提高73%。
OpenFOAM 超線性加速可擴(kuò)展性將2個(gè)96核的AMD EPYC 9684X速度提升 13.9倍,意味著8節(jié)點(diǎn)集群可提供14節(jié)點(diǎn)的性能。
如每天完成165000個(gè)Ansys Fluent模擬計(jì)算任務(wù),需要采用英特爾可擴(kuò)展Platinum 8462Y處理器的21臺(tái)服務(wù)器。相比之下,采用AMD EPYC 9384處理器的服務(wù)器數(shù)量減少43%至12臺(tái),能耗降低38%,運(yùn)營(yíng)成本降低38%,每年二氧化碳減排44噸,三年TCO可降低39%。采用EPYC處理器,意味著更少的服務(wù)器投資、更少的能源與功耗,相應(yīng)地,更少的二氧化碳排放。
第五代EPYC CPU,已經(jīng)在路上
在 “數(shù)據(jù)中心和人工智能技術(shù)首映式(Data Center and Al Technology Premiere)”上,AMD還發(fā)布了AI相關(guān)其他幾款產(chǎn)品,標(biāo)志著AMD收購(gòu)賽靈思的前瞻決策與兩家公司的全面、快速融合。
總結(jié)第四代EPYC處理器的發(fā)展史后Ram Peddibhotla指出,AMD第四代EPYC 96X4系列(代號(hào) Genoa),是世界上最好的數(shù)據(jù)中心通用計(jì)算CPU;而剛剛問(wèn)世的第四代EPYC 97X4系列(代號(hào)Bergamo),是最佳云原生優(yōu)化CPU;一同亮相、采用3D V-Cache技術(shù)的AMD 第四代EPYC 9004X 系列(代號(hào) Genoa- x),則是最佳技術(shù)計(jì)算優(yōu)化的CPU。
看來(lái)得出來(lái),AMDEPYC處理器覆蓋了大量的業(yè)務(wù)應(yīng)用場(chǎng)景。
當(dāng)面向電信和邊緣端的Siena處理器強(qiáng)勢(shì)面世的時(shí)候,AMD 第四代EPYC處理器產(chǎn)品家族將緩緩關(guān)上大門(mén),而另一扇大門(mén),第五代EPYC處理器(Turin)產(chǎn)品線,已經(jīng)在徐徐打開(kāi)。