文字編輯|宋雨涵

1

整場發(fā)布會(huì)重點(diǎn)信息一覽

新發(fā)布涉及十大重點(diǎn)

整場演講信息量爆棚,覆蓋加速計(jì)算、深度推理模型、AI智能體、物理AI、機(jī)器人技術(shù)、自動(dòng)駕駛等在內(nèi)的AI下一個(gè)風(fēng)口,新發(fā)布涉及十大重點(diǎn):

1、Vera Rubin與Rubin Ultra芯片:兩代旗艦芯片HBM內(nèi)存實(shí)現(xiàn)升級(jí),GPU“樂高拼裝”技術(shù)日益成熟。提前揭曉Vera Rubin NVL144機(jī)架及Rubin Ultra NVL576機(jī)架性能,F(xiàn)P4推理性能峰值達(dá)15EFLOPS,基于Rubin的AI工廠性能相較Hopper提升900倍。

2、Blackwell Ultra芯片:全球首款288GB HBM3e GPU亮相,發(fā)布GB300 NVL72機(jī)架及HGX B300 NVL16機(jī)架系統(tǒng)方案,實(shí)現(xiàn)機(jī)架如單一大型GPU般高效運(yùn)行。

3、數(shù)據(jù)中心AI超算方案:推出Blackwell Ultra DGX SuperPOD,搭載全新DGX GB300與DGX B300系統(tǒng),助力企業(yè)輕松構(gòu)建AI超級(jí)計(jì)算機(jī)。同時(shí)發(fā)布AI托管服務(wù)NVIDIA Instant AI Factory及AI數(shù)據(jù)中心運(yùn)營編排軟件NVIDIA Mission Control。

4、AI推理與智能體軟件:AI推理軟件Dynamo在運(yùn)行DeepSeek-R1模型時(shí),GPU生成token數(shù)量提升超30倍。全新Llama Nemotron推理模型系列中,Super 49B版本吞吐量達(dá)Llama 3.3 70B及DeepSeek R1 Llama 70B的5倍。宣布向全球企業(yè)提供構(gòu)建AI智能體的核心模塊,存儲(chǔ)巨頭攜手構(gòu)建企業(yè)級(jí)AI數(shù)據(jù)平臺(tái)。

5、個(gè)人AI超算產(chǎn)品:推出全球最小AI超算DGX Spark及高性能桌面級(jí)AI超算DGX Station,滿足開發(fā)者本地微調(diào)或推理深度思考模型需求。

6、Blackwell芯片進(jìn)展:已全面投入生產(chǎn),銷量較上一代Hopper增長3倍。

7、工作站與服務(wù)器GPU更新:推出RTX Pro Blackwell數(shù)據(jù)中心GPU、桌面級(jí)GPU及筆記本電腦GPU新品。

8、光電一體化封裝網(wǎng)絡(luò)交換機(jī):推出“世界領(lǐng)先”的網(wǎng)絡(luò)解決方案,支持AI工廠擴(kuò)展至數(shù)百萬塊GPU規(guī)模。

9、物理AI與機(jī)器人技術(shù):開源Isaac GR00T N1人形機(jī)器人基礎(chǔ)模型,與迪士尼研究院、谷歌DeepMind合作開發(fā)開源物理引擎Newton。

10、電信AI與自動(dòng)駕駛領(lǐng)域:與通用汽車攜手打造GM AI,為工廠和汽車提供全方位全棧自動(dòng)駕駛安全系統(tǒng)NVIDIA Halos。

Blackwell GPU創(chuàng)下DeepSeek-R1推理性能的世界紀(jì)錄

值得一提的是,英偉達(dá)宣布Blackwell GPU創(chuàng)下滿血版DeepSeek-R1推理性能的世界紀(jì)錄。
單個(gè)配備8塊Blackwell GPU的NVIDIA DGX系統(tǒng),可實(shí)現(xiàn)每位用戶每秒超過250個(gè)token,或每秒超過30000個(gè)token的最大吞吐量。通過硬件和軟件的結(jié)合,英偉達(dá)自今年1月以來將DeepSeek-R1 671B模型的吞吐量提高了約36倍,相當(dāng)于每個(gè)token的成本改善了約32倍。

2

芯片演進(jìn)路線提前曝光

下一代Vera Rubin超級(jí)芯片明年登場!

英偉達(dá)Blackwell芯片自推出以來,在AI行業(yè)取得了顯著成就。據(jù)數(shù)據(jù)顯示,2024年全球前四云服務(wù)提供商共計(jì)采購了130萬片Hopper架構(gòu)芯片,而到了2025年,他們更是購買了360萬片Blackwell芯片。

英偉達(dá)最新財(cái)報(bào)顯示,Blackwell架構(gòu)AI芯片的銷售勢頭極為強(qiáng)勁,在正式出貨的首個(gè)季度就實(shí)現(xiàn)了超百億美元的收入,遠(yuǎn)超公司的預(yù)期。

展望未來,黃仁勛預(yù)計(jì)到2028年,數(shù)據(jù)中心建設(shè)支出將達(dá)到1萬億美元。

近年來,數(shù)據(jù)中心一直是英偉達(dá)營收和利潤的主要來源。在之前的財(cái)報(bào)溝通會(huì)上,黃仁勛和公司CFO均表示,全球?qū)I基礎(chǔ)設(shè)施的需求將持續(xù)增長,因?yàn)榭蛻粝M渴鸶?、更?fù)雜的集群,這不僅需要英偉達(dá)的GPU,還需要其NVLink交換機(jī)、InfiniBand以及Spectrum-X系列網(wǎng)絡(luò)套件。

GTC大會(huì)上,英偉達(dá)推出了新一代芯片Blackwell Ultra(GB300),包括NVIDIA GB300 NVL72機(jī)架級(jí)解決方案和NVIDIA HGX B300 NVL16系統(tǒng)。GB300 NVL72的AI性能是前一代GB200 NVL72的1.5倍,這使得基于GB300構(gòu)建的AI工廠的收入機(jī)會(huì)相比基于Hopper構(gòu)建的系統(tǒng)增加了50倍。

同時(shí),黃仁勛還展示了未來三年芯片架構(gòu)的技術(shù)路線圖。

下一代芯片將被命名為Vera Rubin,預(yù)計(jì)將在2026年下半年接替Blackwell Ultra。而到了2027年下半年,英偉達(dá)將推出Rubin Ultra版本。黃仁勛表示,Rubin的性能將達(dá)到Hopper的900倍,相比之下,Blackwell相較Hopper已經(jīng)實(shí)現(xiàn)了68倍的提升。

此外,英偉達(dá)還計(jì)劃推出Rubin的Ultra版本,以滿足更高性能的需求。不僅如此,黃仁勛還提前透露了Rubin之后的下一代芯片架構(gòu)名稱——Feynman,以著名物理學(xué)家理查德·費(fèi)曼的名字命名,延續(xù)了英偉達(dá)以科學(xué)家命名GPU架構(gòu)的傳統(tǒng)。

四代芯片路線一覽:

“構(gòu)建AI工廠需要數(shù)年前瞻規(guī)劃,我們必須讓客戶看到未來三年的技術(shù)藍(lán)圖。”黃仁勛強(qiáng)調(diào)

三、新旗艦Blackwell Ultra:

全球首個(gè)288GB HBM3e GPU

作為本次大會(huì)的核心產(chǎn)品,Blackwell Ultra GPU以288GB HBM3e內(nèi)存和1.8TB/s NVLink帶寬成為焦點(diǎn)。

其FP4精度算力達(dá)15PFLOPS,推理速度較前代Hopper架構(gòu)提升40倍,支持72顆GPU構(gòu)建單機(jī)架級(jí)解決方案。

搭載該芯片的GB300 NVL72機(jī)架在運(yùn)行DeepSeek-R1 671B模型時(shí),單用戶響應(yīng)速度達(dá)253Token/s,峰值吞吐量突破30,000Token/s,較前代H100系統(tǒng)提升36倍。

黃仁勛現(xiàn)場演示了復(fù)雜推理任務(wù):7人婚宴座位安排問題在10秒內(nèi)完成,而傳統(tǒng)系統(tǒng)需1分半鐘。

技術(shù)突破:

四、機(jī)器人仍是壓軸節(jié)目

具身智能浪潮已經(jīng)到來

在芯片發(fā)布之后,黃仁勛又帶來了全新的AI推理服務(wù)軟件Dynamo,旨在開啟AI工廠的革命性變革。演講的壓軸環(huán)節(jié),機(jī)器人再次登場,但這次不同以往,上臺(tái)的是英偉達(dá)與谷歌、迪士尼聯(lián)合開發(fā)的機(jī)器人Blue(星球大戰(zhàn)主題機(jī)器人)。演示環(huán)節(jié)中,Blue展現(xiàn)出極高的靈活性,能夠準(zhǔn)確聽從指令,且形態(tài)呆萌可愛。

作為算力領(lǐng)域的佼佼者,英偉達(dá)將新的增長希望寄托于機(jī)器人技術(shù)。黃仁勛表示,機(jī)器人技術(shù)的下一波浪潮已經(jīng)到來,它由物理AI驅(qū)動(dòng),使機(jī)器人能夠理解并適應(yīng)物理世界??梢哉f,機(jī)器人時(shí)代已經(jīng)悄然降臨。

在此次大會(huì)上,英偉達(dá)隆重推出了全球首款開源人形機(jī)器人通用基礎(chǔ)模型——GR00T N1。這款模型不僅是世界首款開源的,還具備可定制性,為人形機(jī)器人的發(fā)展提供了全新基礎(chǔ)。

據(jù)介紹,GR00T N1采用了雙系統(tǒng)架構(gòu),這一設(shè)計(jì)靈感來源于人類的認(rèn)知原理。其中,“系統(tǒng)1”負(fù)責(zé)快速思考,類似于人類的直覺和反射反應(yīng);“系統(tǒng)2”則負(fù)責(zé)慢速思考,用于做出深思熟慮的決策。

此外,黃仁勛還宣布了與谷歌DeepMind和迪士尼研究所的合作,共同開發(fā)開源物理引擎Newton。這一引擎將使機(jī)器人能夠更精確地處理復(fù)雜任務(wù),提升其智能化水平。預(yù)計(jì)Newton物理引擎將于2025年晚些時(shí)候正式推出。

黃仁勛對機(jī)器人市場的前景充滿信心,他認(rèn)為這一市場具有巨大的爆發(fā)潛力,并有望成為最大的產(chǎn)業(yè)之一。期待如黃仁勛所言,在AI時(shí)代,每個(gè)人都能成為贏家。

分享到

lixiangjing

算力豹主編

相關(guān)推薦