“真正的AI創(chuàng)新需要開放與合作,”蘇姿豐面對滿座的技術(shù)專家和行業(yè)領(lǐng)袖宣布,“從芯片到軟件再到整個生態(tài)系統(tǒng),我們正在構(gòu)建一條通向高效AI計算的開放之路?!?/p>
這場盛會不僅推出了性能飛躍的MI350系列AI加速器,更展示了完整的端到端集成AI平臺愿景。AMD首次披露了與OpenAI深度合作的下一代MI400路線圖,同時推出全新ROCm 7軟件棧和開發(fā)者云服務(wù)。
文字編輯|宋雨涵
1
硬件革命:
MI350性能飛躍與Venice雙核架構(gòu)
AMD此次發(fā)布的Instinct MI350系列包括MI350X(風(fēng)冷)和MI355X(液冷)兩個型號,代表著公司在AI加速器領(lǐng)域的重大技術(shù)跨越。
據(jù)蘇姿豐介紹,MI350系列的內(nèi)存容量是英偉達(dá)GB200的1.6倍,在多個精度下的運(yùn)算表現(xiàn)優(yōu)于英偉達(dá)GB200和B200。在FP4精度下,當(dāng)運(yùn)行DeepSeek-R1或Llama3.1時,MI355每秒可以產(chǎn)生比英偉達(dá)B200多出20%~30%的tokens(詞元),表現(xiàn)與更昂貴的GB200相當(dāng)。與競爭對手的解決方案相比,客戶投資MI355,每美元的投資能多生成40%的tokens。
按照規(guī)劃,AMD2023年推出Instinct系列的MI300X芯片,2024年推出MI325X,這兩款芯片都采用CDNA3架構(gòu)。據(jù)蘇姿豐介紹,通過推出MI300X和MI325,AMD的芯片已經(jīng)在微軟、Meta、甲骨文等公司進(jìn)行了大規(guī)模部署,在過去9個月里,AMD新增了很多Instinct客戶。目前,頭部的10個AI廠商中,有7家在自家的數(shù)據(jù)中心使用Instinct,包括OpenAI、Meta、xAI、特斯拉。
新推出的MI350系列芯片則采用AMD最新的CDNA4架構(gòu)?!癕I350實(shí)現(xiàn)了Instinct系列史上最大的一次性能飛躍,”蘇姿豐在主題演講中強(qiáng)調(diào),“它為我們客戶的生成式AI和高性能計算需求設(shè)立了新標(biāo)準(zhǔn)?!碧K姿豐表示,MI355在本月早些時候開始生產(chǎn)出貨,第一批合作伙伴將在第三季度推出相關(guān)平臺和公有云實(shí)例。她表示,在MI355之后,AMD已經(jīng)在深入開發(fā)下一代的MI400,MI400將于2026年推出。OpenAI CEO山姆·奧爾特曼則上臺表示,OpenAI已經(jīng)在使用AMD的MI300X芯片做一些工作,他期待后續(xù)MI450的表現(xiàn)。
這些芯片采用臺積電第二代3nm制程工藝,集成了驚人的1850億個晶體管,比上一代MI300系列的1530億增加了20%以上。內(nèi)存配置更是大幅升級,搭載了288GB HBM3E內(nèi)存,帶寬達(dá)到每秒8TB。
與此同時,AMD還預(yù)覽了基于Zen 6微架構(gòu)的下一代EPYC “Venice”處理器。這款采用臺積電2nm工藝的服務(wù)器CPU首次在同代產(chǎn)品中提供雙核心架構(gòu)選項:
Venice處理器通過創(chuàng)新的雙軌核心架構(gòu),為不同AI工作負(fù)載提供了精準(zhǔn)的算力支持。
2
軟件與生態(tài):
ROCm 7的進(jìn)化與開發(fā)者云服務(wù)
此外,AMD在會議上正式發(fā)布了其開源AI軟件棧的最新版本——ROCm7。該軟件棧的推出旨在應(yīng)對生成式AI和高性能計算工作負(fù)載不斷攀升的需求,全方位且顯著地優(yōu)化開發(fā)者的整體使用體驗(yàn)。
ROCm7在多個方面實(shí)現(xiàn)了升級。它增強(qiáng)了對行業(yè)通用框架的支持力度,進(jìn)一步拓展了硬件兼容范圍,還引入了一系列全新的開發(fā)工具、驅(qū)動程序、API以及庫,旨在加快AI開發(fā)和部署的進(jìn)程。無論是AI推理還是訓(xùn)練環(huán)節(jié),ROCm7都增添了更多全新功能。
與上一代ROCm6相比,新一代ROCm7在推理性能上平均提升了3.5倍,在訓(xùn)練性能上提升了3倍。
如今,ROCm的應(yīng)用范疇已拓展至企業(yè)級AI領(lǐng)域,無論是不同的操作系統(tǒng)平臺,還是復(fù)雜的集群管理,ROCm都能提供有力支持。
為降低開發(fā)者門檻,AMD同時宣布全球開放AMD Developer Cloud。這項服務(wù)為開發(fā)者提供完全托管的云環(huán)境,使他們能夠快速獲取啟動AI項目所需的工具和靈活性,實(shí)現(xiàn)無限擴(kuò)展。
AMD的客戶分享了他們利用AMD AI解決方案訓(xùn)練當(dāng)下領(lǐng)先AI模型、開展大規(guī)模推理以及加速AI探索和開發(fā)的經(jīng)驗(yàn)。Meta詳細(xì)介紹了Instinct MI300X在Llama 3和Llama 4推理中的廣泛應(yīng)用,還表達(dá)了對MI350及其計算性能、單位TCO性能和下一代內(nèi)存的期待。Meta表示將繼續(xù)與AMD在AI發(fā)展路線圖上緊密合作,包括未來Instinct MI450平臺的規(guī)劃。
Oracle云基礎(chǔ)設(shè)施(OCI)是首批采用AMD開放式機(jī)架規(guī)模AI基礎(chǔ)設(shè)施和AMD Instinct MI355X GPU的行業(yè)領(lǐng)軍者之一。OCI借助AMD CPU和GPU為AI集群提供均衡、可擴(kuò)展的性能,并宣布將推出由最新AMD Instinct處理器加速的澤塔級AI集群,該集群配備多達(dá)131,072個MI355X GPU,助力客戶大規(guī)模構(gòu)建、訓(xùn)練和推理AI。
此外,HUMAIN、微軟、Cohere、RedHat等合作伙伴也分享了相關(guān)產(chǎn)品的應(yīng)用情況。
未來路線圖:
MI400與OpenAI的深度合作
AMD的產(chǎn)品路線圖展現(xiàn)出前所未有的“激進(jìn)”態(tài)勢。依據(jù)Lisa Su博士公布的規(guī)劃藍(lán)圖,AMD計劃以約每年一次的頻率發(fā)布新品:MI325X將于2024年第四季度上市,MI350系列定于2025年推出,MI400系列則會在2026年面世。這一發(fā)布節(jié)奏與英偉達(dá)“一年推出一款A(yù)I GPU新品”的計劃直接形成對標(biāo),彰顯出AMD已做好與英偉達(dá)展開長期、持續(xù)正面競爭的準(zhǔn)備。
從目前掌握的信息來看,AMD Instinct MI400系列將實(shí)現(xiàn)跨代性能的巨大飛躍,為大規(guī)模訓(xùn)練和分布式推理提供完整的機(jī)柜級解決方案。其關(guān)鍵性能創(chuàng)新亮點(diǎn)包括:配備432GB的HBM4內(nèi)存;擁有19.6TB/s的內(nèi)存帶寬;具備40 PFLOPS的FP4性能和20 PFLOPS的FP8性能;以及300GB/s的橫向擴(kuò)展帶寬。
更具戰(zhàn)略意義的是,AMD首次公開承認(rèn)了與OpenAI的深度合作關(guān)系。公司明確表示MI400系列是與OpenAI聯(lián)合研發(fā)的,OpenAI為訓(xùn)練和推理需求提供了重要反饋。
此外,AMD還推出了Helios AI機(jī)柜基礎(chǔ)設(shè)施。該基礎(chǔ)設(shè)施從底層架構(gòu)著手構(gòu)建,旨在將下一代領(lǐng)先的硬件——涵蓋AMD EPYC“Venice”CPU、Instinct MI400系列GPU和Pensando“Vulcano”AI智能網(wǎng)卡——與ROCm軟件統(tǒng)一整合,形成一個完全集成的解決方案。
Helios被設(shè)計為一個統(tǒng)一系統(tǒng),支持一個緊密耦合的縱向擴(kuò)展域,最多可容納72個MI400系列GPU,提供每秒260太字節(jié)的縱向擴(kuò)展帶寬,并支持Ultra Accelerator Link。
結(jié)語:
聚光燈下的MI350系列與Venice雙核處理器,不僅是AMD技術(shù)的里程碑,更是其開放生態(tài)戰(zhàn)略擲地有聲的宣言。當(dāng)蘇姿豐與奧特曼同臺,預(yù)示著頂級AI玩家正積極尋求打破單一供應(yīng)格局,而AMD的硬件迭代、軟件進(jìn)化與能效革命,恰好提供了極具吸引力的替代方案。
挑戰(zhàn)英偉達(dá)的霸主地位絕非朝夕之功,CUDA生態(tài)的壁壘依然高聳。但AMD正通過差異化路徑破局:以極致的推理性能、突破性的能效比,以及真正開放的ROCm生態(tài),精準(zhǔn)切入大模型部署與綠色計算的痛點(diǎn)。甲骨文13萬GPU的超級AI集群部署、OpenAI的深度合作背書,都證明了市場對“第二選擇”的強(qiáng)烈渴求。
未來之爭,將超越單純的算力比拼。MI400與Helios平臺勾勒的愿景,是“系統(tǒng)級優(yōu)化”的終極形態(tài)——從芯片、互聯(lián)到軟件棧的垂直整合,旨在最大化實(shí)際工作負(fù)載效率。而2030年機(jī)架級能效提升20倍的承諾,則直指AI規(guī)模擴(kuò)張的核心瓶頸,將可持續(xù)發(fā)展從口號變?yōu)楹诵母偁幜Α?/p>