AMD Versal Premium系列架構(gòu)概覽
根據(jù)AMD的計(jì)劃,今年第四季度提供功率估算工具,2025年下半年提供全套的AMD Vivado工具。2026年上半年將提供芯片的樣片以及開發(fā)套件,2026年中實(shí)現(xiàn)芯片量產(chǎn)。
初識:第二代AMD Versal Premium系列產(chǎn)品
第二代AMD Versal Premium系列產(chǎn)品,基于已經(jīng)量產(chǎn)一年的第一代產(chǎn)品AMD Versal架構(gòu)的成熟解決方案而構(gòu)建,以低風(fēng)險(xiǎn)整合新架構(gòu)模塊擴(kuò)展了第一代AMD Versal Premium系列的極限硬IP集成。
需要指出的是,第一代產(chǎn)品AMD Versal的所有單元塊在第二代里都是復(fù)用的設(shè)計(jì)。再加上AMD針對I/O、收發(fā)器以及存儲/內(nèi)存的控制器、主機(jī)的接口展開的創(chuàng)新,這樣的開發(fā)模式能夠保證推廣部署非常順利并迅速實(shí)現(xiàn)過渡。
第二代AMD Versal Premium系列六大技術(shù)創(chuàng)新
從產(chǎn)品架構(gòu)圖可以看出,第二代AMD Versal Premium系列其DSP計(jì)算密度實(shí)現(xiàn)了更高的每平方毫米DSP算力、高DSP與LUT比率,引入的新的128G收發(fā)器,其協(xié)議覆蓋范圍從1.25G-128Gb/s線速;在IO方面,增加了對高速M(fèi)IPIC-PHY( 10Gbps)、MIPI D-PHY ( 4.5 Gbps)接口的支持,內(nèi)存采用DDR5-6400及LPDDR5X-8533,至多8個(gè)控制器、CXL存儲器擴(kuò)展模塊,PCle Gen6與CXL 3.1,雙 x8主機(jī)接口、集成DMA,PCle完整性與數(shù)據(jù)加密,內(nèi)聯(lián)DDR加密與ECC,安全性得到了進(jìn)一步的強(qiáng)化。
這六大創(chuàng)新,賦予第二代AMD Versal Premium系列三大特征。
深度了解:三大特征
技術(shù)的發(fā)展與應(yīng)用的深入,沉淀出越來越多的數(shù)據(jù),對基礎(chǔ)設(shè)施在帶寬、性能、效率以及環(huán)保、安全防護(hù)等方面的要求越來越高。在AI的迅速發(fā)展和重度使用下,這些挑戰(zhàn)變得越來越重要。Mike Rather高興地介紹說,第二代AMD Versal Premium系列充滿了創(chuàng)新,這些創(chuàng)新體現(xiàn)在三個(gè)領(lǐng)域:加速主機(jī)連接、釋放更多內(nèi)存和加強(qiáng)數(shù)據(jù)安全。
AMD自適應(yīng)和嵌入式計(jì)算事業(yè)部高級產(chǎn)品線經(jīng)理Mike Rather
第二代AMD Versal Premium系列采用PCIe Gen 6和CXL 3.1,以64Gb/s的速率加速主機(jī)連接,在更快釋放內(nèi)存方面,LPDDR5X和DDR5分別以8533Mb/s、6400 Mb/s的速度提升這一進(jìn)程,CXL存儲器擴(kuò)展模塊支持更多的存儲器接口,而在增強(qiáng)數(shù)據(jù)安全性方面,AMD增加了完整性和數(shù)據(jù)加密、硬內(nèi)聯(lián)ECC和加密用于DDR存儲器;另外還有400G高速加密引擎確保網(wǎng)絡(luò)安全性——這個(gè)最初是在第一代的Versal產(chǎn)品里就引入的。
1.加速主機(jī)連接
加速主機(jī)的連接對于高端計(jì)算應(yīng)用非常關(guān)鍵。
在當(dāng)下,DDR5已經(jīng)成為行業(yè)最為廣泛采用的主流趨勢,連接CXL的內(nèi)存未來5年也將有212%的年復(fù)合增長率,正在出貨的服務(wù)器中半數(shù)已經(jīng)提供對CXL的支持。從架構(gòu)的角度,這些都意味著更快的主機(jī)連接、更多的內(nèi)存以及更加連貫的接口。
采用PCIe Gen 6、LPDDR5X和CXL 3.0等逐步支持這些趨勢的架構(gòu),就顯得越來越重要了。
AMD在Versal Premium自適應(yīng)SoC和AMD EPYC CPU之間能夠形成非常好的協(xié)同。PCIe Express提供Versal Premium和CPU之間非常高性能的連接,可以用于卸載計(jì)算、網(wǎng)絡(luò)以及存儲工作負(fù)載,還擁有非常連貫的接口,這樣Versal Premium和EPYC處理器就能夠共享內(nèi)存空間,從而減少擱置內(nèi)存,再加上PCIe IDE以及內(nèi)存DRAM的加密,數(shù)據(jù)能夠做到端到端的安全性。
第二代AMD Versal Premium系列產(chǎn)品還提供一個(gè)叫做GTM2的新的收發(fā)器,它不僅能夠結(jié)合第一代Versal Premium產(chǎn)品上的兩個(gè)收發(fā)器GTM與GTM1使用,還支持從1.25Gb/s到128Gb/s的數(shù)據(jù)速率以及NRZ和PAM4編碼,實(shí)現(xiàn)數(shù)據(jù)流最大化,同時(shí),AMD也保留了非常熟悉的設(shè)計(jì)流程,支持開發(fā)者使用GTM2,并確保全過程的可靠性。
2.釋放更多內(nèi)存
人工智能應(yīng)用的不斷深入,導(dǎo)致數(shù)據(jù)總量越來越多,因此,更快速釋放更多內(nèi)存也非常重要。第二代AMD Versal Premium系列產(chǎn)品通過在DDR5和LPDDR5上支持,數(shù)據(jù)傳輸速率是第一代產(chǎn)品支持的DDR4和LPDDR4的2倍,消耗的功率下降了20%~30%,硬內(nèi)聯(lián)ECC與加密加強(qiáng)了內(nèi)存保護(hù)。
通過對CXL 3.1規(guī)范設(shè)計(jì)的遵從,第二代AMD Versal Premium系列產(chǎn)品可以兼容多數(shù)DRAM供應(yīng)商,實(shí)現(xiàn)內(nèi)存的增加,同時(shí),LPDDR5X使得總可用存儲器帶寬至高可達(dá)到256x 8.533 Gb/s,使用兩個(gè)8道CXL的連接,速率可以達(dá)到64Gb/s。通過這樣的架構(gòu),從外部存儲器的帶寬可以超過500Gb/s。
3.端到端安全性
在不斷惡化的安全形勢下,增強(qiáng)數(shù)據(jù)安全性正變得日益重要。
第二代AMD Versal Premium系列產(chǎn)品提供了PCIe IDE加上高速加密引擎、DDR內(nèi)聯(lián)加密與ECC,確保數(shù)據(jù)無論是在傳輸中、靜態(tài)中還是使用中都,具有非常高度的安全性,堪稱全球唯一基于靈活應(yīng)變平臺的400G高速加密引擎。
專屬開發(fā)的應(yīng)用場景
Mike Rather介紹了第二代AMD Versal Premium系列的專屬開發(fā)應(yīng)用場景。
1.CXL 3.1釋放更多內(nèi)存
在擴(kuò)大數(shù)據(jù)中心的CXL范圍領(lǐng)域,第二代AMD Versal Premium系列不僅可以擴(kuò)大內(nèi)存,還可以提供高性能的內(nèi)存接口。CXL 3.1使用PCIe Gen 6協(xié)議,比CXL 2.0高出一倍的帶寬,利用NUMA,可輕松與現(xiàn)有的軟件集成。
第二代AMD Versal Premium系列支持CXL.io、CXL.mem、CXL.cache,因此在器件模式方面,Versal Premium可以作為內(nèi)存控制器,支持Type-1、Type-2、Type-3 | DCOH,在主機(jī)模式方面,支持Type-3 | 本地代理。這樣就可以連接之前給大家展示過的CXL擴(kuò)展模塊。實(shí)際應(yīng)用過程中,既可用于內(nèi)存池和分層、多主機(jī)單邏輯設(shè)備(MH-SLD)架構(gòu),還可支持鄰存計(jì)算與系統(tǒng)可組合性。
2.自適應(yīng)網(wǎng)絡(luò)用于GPU集群和橫向擴(kuò)展
適應(yīng)人工智能的需求,很多客戶都已經(jīng)購買并部署GPU的集群,而標(biāo)準(zhǔn)的網(wǎng)絡(luò)接口卻未必能夠支持在這樣情境下GPU的性能和靈活性。第二代AMD Versal Premium以很高的帶寬和靈活性,滿足了這方面的應(yīng)用需求。這是多年前AMD在Virtex UltraScale+和第一代Versal Premium上都支持過的。不同的是,第二代AMD Versal Premium系列能夠在單個(gè)網(wǎng)絡(luò)適配器上支持2個(gè)400G接口。
3.測試與測量:推進(jìn)下一代協(xié)議
時(shí)下大眾感興趣的開發(fā)PCIe Gen 7器件以及下一代MIPI攝像機(jī)等測試儀要求128Gb/s的收發(fā)器以提供高吞吐量和采樣率,要求高DSP與邏輯密度,以適用于緊湊型設(shè)備,要求CXL 3.1 存儲器擴(kuò)展、LPDDR5-8533以實(shí)現(xiàn)深度抓取,要求同一I/O上的D-PHY或C-PHY以便輕松交換測試模塊……所有這些,也都是第二代AMD Versal Premium系列支持的。
第二代AMD Versal Premium系列產(chǎn)品適用于大數(shù)據(jù)量以及高計(jì)算密度的應(yīng)用場景,包括數(shù)據(jù)中心、通信、測試與測量的場景。
在通信行業(yè),支持6G RAN加速/AI、城域/核心交通、數(shù)據(jù)中心互聯(lián)、安全設(shè)備;為數(shù)據(jù)中心提供計(jì)算加速、定制AI網(wǎng)絡(luò)、計(jì)算存儲、企業(yè)級SSD支持,在測試與測量方面,可用于PCle Gen7分析器攝像頭傳感器測試儀、無線測試儀、存儲/CXL測試儀領(lǐng)域。
針對Versal產(chǎn)品組合的Vivado工具計(jì)劃
每次Vivado版本發(fā)布,都為Versal用戶帶來工作效率的提升與良好應(yīng)用體驗(yàn)。
Vivado是所有Versal器件統(tǒng)一的設(shè)計(jì)環(huán)境,提升Versal用戶工作效率與應(yīng)用體驗(yàn)。AMD不斷地改善和優(yōu)化這個(gè)環(huán)節(jié),第二代AMD Versal Premium系列也不例外:首先,通過采用新的P&R算法、改善多線程的性能、增強(qiáng)的增量流的措施來減少編譯時(shí)間;同時(shí),AMD還引入了用于頂層設(shè)計(jì)、NoC2、GTM2的RTL流程,為開發(fā)人員提供友好型設(shè)計(jì)入口;第三,AMD還改善了質(zhì)量結(jié)果,也即QoR與易用性,通過工具引導(dǎo)的時(shí)序收斂,改進(jìn)的DFX流程以及分段配置,從而加快CPU啟動時(shí)間和PCIe的喚醒。
關(guān)鍵:應(yīng)對用戶不斷變化的需求
據(jù)了解,上一代AMD Versal Premium采用的是7nm制程,第二代Versal Premium更進(jìn)一步,采用的是是6nm制程。AMD自適應(yīng)與嵌入式計(jì)算事業(yè)部( AECG ) Versal產(chǎn)品營銷總監(jiān)Manuel Uhm介紹說,隨著摩爾法則的衰減,制程的重要性越來越低,更重要的是架構(gòu),不可能像過去那樣以一半的功耗達(dá)到雙倍的性能;關(guān)鍵是取決于應(yīng)用場景的需求。
Manuel Uhm強(qiáng)調(diào):“AMD Versal Premium系列產(chǎn)品總是能夠非常精準(zhǔn)地去針對關(guān)鍵應(yīng)用,確保能夠有最合適的算力、I/O以及內(nèi)存的組合,實(shí)現(xiàn)最高的性價(jià)比?!?/p>
的確,滿足用戶不斷變化的需求,這才是最重要的。