夜夜嗨一区二区三区,樱花草社区在线播放,亚洲精品久久国产高清情趣

“真正的AI創(chuàng)新需要開(kāi)放與合作，”蘇姿豐面對(duì)滿座的技術(shù)專(zhuān)家和行業(yè)領(lǐng)袖宣布，“從芯片到軟件再到整個(gè)生態(tài)系統(tǒng)，我們正在構(gòu)建一條通向高效AI計(jì)算的開(kāi)放之路?！?/p>

這場(chǎng)盛會(huì)不僅推出了性能飛躍的MI350系列AI加速器，更展示了完整的端到端集成AI平臺(tái)愿景。AMD首次披露了與OpenAI深度合作的下一代MI400路線圖，同時(shí)推出全新ROCm 7軟件棧和開(kāi)發(fā)者云服務(wù)。

文字編輯｜宋雨涵

硬件革命：

MI350性能飛躍與Venice雙核架構(gòu)

AMD此次發(fā)布的Instinct MI350系列包括MI350X（風(fēng)冷）和MI355X（液冷）兩個(gè)型號(hào)，代表著公司在AI加速器領(lǐng)域的重大技術(shù)跨越。

據(jù)蘇姿豐介紹，MI350系列的內(nèi)存容量是英偉達(dá)GB200的1.6倍，在多個(gè)精度下的運(yùn)算表現(xiàn)優(yōu)于英偉達(dá)GB200和B200。在FP4精度下，當(dāng)運(yùn)行DeepSeek-R1或Llama3.1時(shí)，MI355每秒可以產(chǎn)生比英偉達(dá)B200多出20%~30%的tokens（詞元），表現(xiàn)與更昂貴的GB200相當(dāng)。與競(jìng)爭(zhēng)對(duì)手的解決方案相比，客戶(hù)投資MI355，每美元的投資能多生成40%的tokens。

按照規(guī)劃，AMD2023年推出Instinct系列的MI300X芯片，2024年推出MI325X，這兩款芯片都采用CDNA3架構(gòu)。據(jù)蘇姿豐介紹，通過(guò)推出MI300X和MI325，AMD的芯片已經(jīng)在微軟、Meta、甲骨文等公司進(jìn)行了大規(guī)模部署，在過(guò)去9個(gè)月里，AMD新增了很多Instinct客戶(hù)。目前，頭部的10個(gè)AI廠商中，有7家在自家的數(shù)據(jù)中心使用Instinct，包括OpenAI、Meta、xAI、特斯拉。

新推出的MI350系列芯片則采用AMD最新的CDNA4架構(gòu)?！癕I350實(shí)現(xiàn)了Instinct系列史上最大的一次性能飛躍，”蘇姿豐在主題演講中強(qiáng)調(diào)，“它為我們客戶(hù)的生成式AI和高性能計(jì)算需求設(shè)立了新標(biāo)準(zhǔn)。”蘇姿豐表示，MI355在本月早些時(shí)候開(kāi)始生產(chǎn)出貨，第一批合作伙伴將在第三季度推出相關(guān)平臺(tái)和公有云實(shí)例。她表示，在MI355之后，AMD已經(jīng)在深入開(kāi)發(fā)下一代的MI400，MI400將于2026年推出。OpenAI CEO山姆·奧爾特曼則上臺(tái)表示，OpenAI已經(jīng)在使用AMD的MI300X芯片做一些工作，他期待后續(xù)MI450的表現(xiàn)。

這些芯片采用臺(tái)積電第二代3nm制程工藝，集成了驚人的1850億個(gè)晶體管，比上一代MI300系列的1530億增加了20%以上。內(nèi)存配置更是大幅升級(jí)，搭載了288GB HBM3E內(nèi)存，帶寬達(dá)到每秒8TB。

與此同時(shí)，AMD還預(yù)覽了基于Zen 6微架構(gòu)的下一代EPYC “Venice”處理器。這款采用臺(tái)積電2nm工藝的服務(wù)器CPU首次在同代產(chǎn)品中提供雙核心架構(gòu)選項(xiàng)：

Zen 6c高密度核心：256核設(shè)計(jì)，適用于容器化部署和AI推理集群

Zen 6高性能核心：96核設(shè)計(jì)，聚焦HPC和AI訓(xùn)練場(chǎng)景

Venice處理器通過(guò)創(chuàng)新的雙軌核心架構(gòu)，為不同AI工作負(fù)載提供了精準(zhǔn)的算力支持。

軟件與生態(tài)：

ROCm 7的進(jìn)化與開(kāi)發(fā)者云服務(wù)

此外，AMD在會(huì)議上正式發(fā)布了其開(kāi)源AI軟件棧的最新版本——ROCm7。該軟件棧的推出旨在應(yīng)對(duì)生成式AI和高性能計(jì)算工作負(fù)載不斷攀升的需求，全方位且顯著地優(yōu)化開(kāi)發(fā)者的整體使用體驗(yàn)。

ROCm7在多個(gè)方面實(shí)現(xiàn)了升級(jí)。它增強(qiáng)了對(duì)行業(yè)通用框架的支持力度，進(jìn)一步拓展了硬件兼容范圍，還引入了一系列全新的開(kāi)發(fā)工具、驅(qū)動(dòng)程序、API以及庫(kù)，旨在加快AI開(kāi)發(fā)和部署的進(jìn)程。無(wú)論是AI推理還是訓(xùn)練環(huán)節(jié)，ROCm7都增添了更多全新功能。

與上一代ROCm6相比，新一代ROCm7在推理性能上平均提升了3.5倍，在訓(xùn)練性能上提升了3倍。

如今，ROCm的應(yīng)用范疇已拓展至企業(yè)級(jí)AI領(lǐng)域，無(wú)論是不同的操作系統(tǒng)平臺(tái)，還是復(fù)雜的集群管理，ROCm都能提供有力支持。

為降低開(kāi)發(fā)者門(mén)檻，AMD同時(shí)宣布全球開(kāi)放AMD Developer Cloud。這項(xiàng)服務(wù)為開(kāi)發(fā)者提供完全托管的云環(huán)境，使他們能夠快速獲取啟動(dòng)AI項(xiàng)目所需的工具和靈活性，實(shí)現(xiàn)無(wú)限擴(kuò)展。

AMD的客戶(hù)分享了他們利用AMD AI解決方案訓(xùn)練當(dāng)下領(lǐng)先AI模型、開(kāi)展大規(guī)模推理以及加速AI探索和開(kāi)發(fā)的經(jīng)驗(yàn)。Meta詳細(xì)介紹了Instinct MI300X在Llama 3和Llama 4推理中的廣泛應(yīng)用，還表達(dá)了對(duì)MI350及其計(jì)算性能、單位TCO性能和下一代內(nèi)存的期待。Meta表示將繼續(xù)與AMD在AI發(fā)展路線圖上緊密合作，包括未來(lái)Instinct MI450平臺(tái)的規(guī)劃。

Oracle云基礎(chǔ)設(shè)施（OCI）是首批采用AMD開(kāi)放式機(jī)架規(guī)模AI基礎(chǔ)設(shè)施和AMD Instinct MI355X GPU的行業(yè)領(lǐng)軍者之一。OCI借助AMD CPU和GPU為AI集群提供均衡、可擴(kuò)展的性能，并宣布將推出由最新AMD Instinct處理器加速的澤塔級(jí)AI集群，該集群配備多達(dá)131,072個(gè)MI355X GPU，助力客戶(hù)大規(guī)模構(gòu)建、訓(xùn)練和推理AI。

此外，HUMAIN、微軟、Cohere、RedHat等合作伙伴也分享了相關(guān)產(chǎn)品的應(yīng)用情況。

未來(lái)路線圖：

MI400與OpenAI的深度合作

AMD的產(chǎn)品路線圖展現(xiàn)出前所未有的“激進(jìn)”態(tài)勢(shì)。依據(jù)Lisa Su博士公布的規(guī)劃藍(lán)圖，AMD計(jì)劃以約每年一次的頻率發(fā)布新品：MI325X將于2024年第四季度上市，MI350系列定于2025年推出，MI400系列則會(huì)在2026年面世。這一發(fā)布節(jié)奏與英偉達(dá)“一年推出一款A(yù)I GPU新品”的計(jì)劃直接形成對(duì)標(biāo)，彰顯出AMD已做好與英偉達(dá)展開(kāi)長(zhǎng)期、持續(xù)正面競(jìng)爭(zhēng)的準(zhǔn)備。

從目前掌握的信息來(lái)看，AMD Instinct MI400系列將實(shí)現(xiàn)跨代性能的巨大飛躍，為大規(guī)模訓(xùn)練和分布式推理提供完整的機(jī)柜級(jí)解決方案。其關(guān)鍵性能創(chuàng)新亮點(diǎn)包括：配備432GB的HBM4內(nèi)存；擁有19.6TB/s的內(nèi)存帶寬；具備40 PFLOPS的FP4性能和20 PFLOPS的FP8性能；以及300GB/s的橫向擴(kuò)展帶寬。

更具戰(zhàn)略意義的是，AMD首次公開(kāi)承認(rèn)了與OpenAI的深度合作關(guān)系。公司明確表示MI400系列是與OpenAI聯(lián)合研發(fā)的，OpenAI為訓(xùn)練和推理需求提供了重要反饋。

此外，AMD還推出了Helios AI機(jī)柜基礎(chǔ)設(shè)施。該基礎(chǔ)設(shè)施從底層架構(gòu)著手構(gòu)建，旨在將下一代領(lǐng)先的硬件——涵蓋AMD EPYC“Venice”CPU、Instinct MI400系列GPU和Pensando“Vulcano”AI智能網(wǎng)卡——與ROCm軟件統(tǒng)一整合，形成一個(gè)完全集成的解決方案。

Helios被設(shè)計(jì)為一個(gè)統(tǒng)一系統(tǒng)，支持一個(gè)緊密耦合的縱向擴(kuò)展域，最多可容納72個(gè)MI400系列GPU，提供每秒260太字節(jié)的縱向擴(kuò)展帶寬，并支持Ultra Accelerator Link。

結(jié)語(yǔ)：

聚光燈下的MI350系列與Venice雙核處理器，不僅是AMD技術(shù)的里程碑，更是其開(kāi)放生態(tài)戰(zhàn)略擲地有聲的宣言。當(dāng)蘇姿豐與奧特曼同臺(tái)，預(yù)示著頂級(jí)AI玩家正積極尋求打破單一供應(yīng)格局，而AMD的硬件迭代、軟件進(jìn)化與能效革命，恰好提供了極具吸引力的替代方案。

挑戰(zhàn)英偉達(dá)的霸主地位絕非朝夕之功，CUDA生態(tài)的壁壘依然高聳。但AMD正通過(guò)差異化路徑破局：以極致的推理性能、突破性的能效比，以及真正開(kāi)放的ROCm生態(tài)，精準(zhǔn)切入大模型部署與綠色計(jì)算的痛點(diǎn)。甲骨文13萬(wàn)GPU的超級(jí)AI集群部署、OpenAI的深度合作背書(shū)，都證明了市場(chǎng)對(duì)“第二選擇”的強(qiáng)烈渴求。

未來(lái)之爭(zhēng)，將超越單純的算力比拼。MI400與Helios平臺(tái)勾勒的愿景，是“系統(tǒng)級(jí)優(yōu)化”的終極形態(tài)——從芯片、互聯(lián)到軟件棧的垂直整合，旨在最大化實(shí)際工作負(fù)載效率。而2030年機(jī)架級(jí)能效提升20倍的承諾，則直指AI規(guī)模擴(kuò)張的核心瓶頸，將可持續(xù)發(fā)展從口號(hào)變?yōu)楹诵母?jìng)爭(zhēng)力。

分享到

AMD

lixiangjing

算力豹主編

lixiangjing

相關(guān)推薦

近期文章

熱門(mén)標(biāo)簽