(圖片源于網絡)

ChatGPT的火爆,以及東數(shù)西算、數(shù)字化轉型等應用的強勁增長,使得全球算力呈現(xiàn)供應緊張的現(xiàn)象;坊間傳聞,英偉達(NVIDIA)的AI芯片供貨已經排隊到明年二季度,有人甚至把當下人工智能熱度降溫,歸結于算力的供不應求。

算力就是生產力,數(shù)字基礎設施的重要性也不言而喻。

那么,算力需求和缺口該如何填補?

其實,AI芯片主要分為圖形處理器(GPU)、現(xiàn)場可編程門陣列(FPGA)、專用集成電路(ASIC)、中央處理器(CPU)等類腦芯片四大類。面對強勁的算力需求,AI芯片作為算力的硬件基石,更需要多種AI芯片各司其職,共同協(xié)作。

今年6月份舉辦的“數(shù)據中心與AI技術首映”上,AMD在第四代EPYC(霄龍) CPU產品組合中增加兩款新的工作負載優(yōu)化處理器——Bergamo和Genoa-X,以及適用于生成式AI的下一代 AMD Instinct 產品。這無疑將大大緩解算力緊缺的局面,同時也會顯著降低客戶的投資成本和最終用戶的使用成本。

AMD董事會主席及CEO蘇姿豐(Lisa Su)博士舉起的不僅僅是EPYC,也托起了人們對人工智能與計算領域新的希冀。

為什么這么說呢?兩年前,AMD曾宣布在2025年實現(xiàn)EPYC 處理器和AMD Instinct加速器能效提高30倍的目標,這些產品也將為運行在加速計算節(jié)點上的AI訓練和高性能計算應用提供算力支持。

這不是空話,很多事例已經證明了這一點。例如,唯一投入實用的百億億次超算——“Frontier”,就使用了AMD的第三代EPYC 處理器及Instinct MI250X加速卡這對好拍檔。EPYC、Instinct強強聯(lián)手的同時,它們也是開放的,可以搭檔友商的硬件來使用。

Frontier超級計算機(圖片源于網絡)

此外,峰值性能有望超過200億億次的超算預計將于明年在美國勞倫斯利弗莫爾國家實驗室亮相。這款名稱“EI Capitan”的超級計算機配備AMD第四代EPYC處理器(Genoa)和最新Instinct MI300A加速器。

2022年11月AMD推出了基于chiplet打造的EPYC第四代處理器Genoa,其以最快的運行速度、出色的每插槽性能和每核心性能、超強的安全性、豐富的解決方案生態(tài)系統(tǒng),為不同的工作負載提供領先的能源效率和最佳的TCO。

2P SPECrate_2017_int_base、2P Enterprise Server-Side Java、2P VMmark 3.1.1、2P SAP Sales 8 Distribution等平臺提供的測試數(shù)據顯示AMD EPYC 9654對比英特爾最優(yōu)至強8490H處理器的優(yōu)勢。

“以更少的投資,獲取更多的價值。”AMD EPYC的這種領先優(yōu)勢一直延續(xù)至今。

如今,第四代EPYC處理器還擁有了新的系列,分別是“Genoa-X”和“Bergamo”,還有即將發(fā)布的“Siena”。

加載了AMD 3D V-Cache技術的“Genoa-X”,其采用的是5nm制程工藝的第四代Zen 4架構,比上一代Zen3架構能效高出62%,同等功耗下性能提升49%。通過3D V-Cache技術在每個CCD上額外堆疊64MB緩存,緩存總量高達1254MB,再輔以AMD Infinity、Guard安全性與更加豐富的解決方案生態(tài),其性能大大提升,有效支持電子設計自動化相關的計算(EDA)、計算流體動力學(CFD)、有限元分析(FEA)和結構分析(SA)。

運行在Ansys基準測試上,AMD 96核的EPYC 9684X比英特爾60核Xeon Platinum 8490H的計算性能優(yōu)勢超出1-2倍。

采用AMD 3D V-Cache的第四代AMD EPYC處理器Genoa-X 在Ansys CFX中每天可完成更多的設計任務,從而大幅加速產品開發(fā);而運行ANSYS Fluent的性能最高達到了英特爾60核的Xeon Platinum 8490H處理器的2.9倍 有效模擬和優(yōu)化產品外部空氣動力學特征,促進客戶改進產品外觀、提高工作效率、節(jié)省能源消耗;在OpenFOAM的測試中最高也達到英特爾Xeon Platinum 8490H的2.2倍,這意味著技術計算工作負載可在更少計算節(jié)點上獲得高性能表現(xiàn),讓用戶可用更少的機器來獲得更好的負載性能表現(xiàn)。

EPYC 97X4(Bergamo)系列處理器采用了Zen4c架構,它是AMD專門為云計算場景打造的一款CPU核心,與Zen4架構保持了相同的IPC性能和ISA指令集,通過在設計上的多項優(yōu)化,使得核心面積大幅縮小,功耗效率大幅提升。Zen4c EPYC處理器搭載128個核心256個線程,超過了Zen4的96個核心192個線程。Bergaomo提供了可擴展性、靈活性、抗壓性、速度、可視化,支持建模、簡化部署和管理,是支持云原生開發(fā)與應用的得力武器。

Bergamo有三個版本:9754、9754S、9734,核心從112到128個,三級緩存均為256MB。其中EPYC 9754的同步多線程技術(SMT)可以配置——開啟后可降低總體擁有成本。

AMD EPYC 9754 平均吞吐量性能提升2.9倍。比Ampere Altra Max 128C高出3.7倍,比英特爾Xeon Platinum8490H系列最少也高出了50%。

經過NGINX、Redis、Cassandra-test、Memcached、FFmpeg、MySQL TPROC-C、Server-side Java Max等平臺運行測試,EPYC 9754的平均吞吐量、性能均數(shù)倍于友商。

要實現(xiàn)每秒處理3.75億的實時需求,與128核的2P Ampere Altra相比,同核數(shù)的2P AMD EPYC 9754S可以節(jié)省55%的服務器數(shù),年度節(jié)省39%的耗電量、39%的運營成本,最終減少19%的總體擁有成本。

最近,中國電子技術標準化研究院審查和公告后的2023年首輪CPUBench公開測試活動報告顯示,搭載AMD EPYC 9754處理器的新華三UniServer R5500 G6Typical分數(shù)拿到了572.8的最好成績。英特爾平臺最好成績排第四,基于Xeon Platinum 8490H處理器的新華三R6900G6成績?yōu)?49.1,比AMD最好成績落后27.5%。

從第三代EPYC處理器開始,AMD的處理器產品線呈現(xiàn)出了多元化態(tài)勢,第四代EPYC處理器更是根據市場做了細分,除了保持傳統(tǒng)優(yōu)勢的通用型產品,還針對云原生應用、計算技術以及面向電信與邊緣端演繹拓展,產品家族越來越豐富的同時,為客戶需求提供更加精準的解決方案和服務,也為目前的算力困境提出了多種不同的產品組合,助力算力突圍。

產品只是AMD面向從云端到邊緣再到端點的全面應用支持的舉措之一。AMD還在架構方面和生態(tài)系統(tǒng)合作伙伴攜手打造經驗證的開放式解決方案,應對全球算力面臨的嚴峻挑戰(zhàn)。

基于EPYC 9754、9684X與EPYC 9654在密度、能效、頻率等特性方面對比

AMD不僅開發(fā)了大量軟件及開源平臺,同時也與合作伙伴緊密牽手,以適配更多的應用,支持更多的業(yè)務需求。

在鞏固拓展EPYC處理器應用范圍的同時,AMD的生態(tài)圈在不斷擴大,目前已經擁有AWS、Oracle、ASUS、聯(lián)想、戴爾、HPE、Supermicro、思科、谷歌云、微軟Azure、騰訊云等大量的生態(tài)伙伴。

前不久,一家市場份額居國內前茅的服務器供應商,在其產品戰(zhàn)略發(fā)布會期間向筆者透露,該公司生產的服務器中,采用EPYC處理器的數(shù)量占比接近30%。這是一個很了不起出的數(shù)字——兩年前,這家公司的CEO親口告訴筆者,公司只選擇另外一家供應商的處理器。

看得出來,AMD EPYC已經成為當前市場上性能最為強勁的處理器,其以憑借先進的制程工藝、架構技術以及更多的核心、更高的頻率,在整體綜合性、多核整數(shù)性能、多核浮點性能都穩(wěn)居前列;面向AI與未來計算領域,EPYC處理器用配置與測試結果說話, 方方面面“吊打”英特爾,也在AI算力競賽中取得了先機。伴隨AMD在技術、服務和生態(tài)等方面的不斷突破,筆者相信,AMD EPYC處理器將在未來眾多領域、尤其是AI算力領域,將扮演更為重要的角色。

AMD的成功之道,在于“創(chuàng)新”二字。要敢于創(chuàng)新,勇于創(chuàng)新。但創(chuàng)新并非易事,AMDEPYC的故事向我們展示:企業(yè)的成功并沒有捷徑,踏踏實實做產品才是王道。

分享到

xiesc

相關推薦