關(guān)于「算力豹」(微信公眾號搜索:dethinktank)
?▌Blackwell新架構(gòu)在萬億參數(shù)級的大模型的成本和能耗較前代改善25倍?

30年來,人們一直追求實現(xiàn)加速運算和AI等變革性突破, 生成式AI是當前決定性技術(shù)。生成式 AI 的下一步是多模態(tài)和視頻,也就意味著更大規(guī)模的訓練。相對的是,算力市場也在升溫,硬件和軟件方面的競爭都在加劇。

而英偉達帶來的產(chǎn)品總是再次將AI芯片的標桿推向了難以想象的高度。全球的科技公司都還在爭搶Hooper(H100)芯片,但新一代產(chǎn)品已來。

今天凌晨四點,加州圣何塞,在堪比科技界伍茲塔克(Woodstock)音樂節(jié)的GTC大會上,英偉達推出新一代AI圖形處理器芯片(GPU)架構(gòu)Blackwell,并重磅發(fā)布采用該架構(gòu)的GPU——B200GB200產(chǎn)品系列。GB200集成了1個Grace CPU和2個B200 GPU,號稱是全世界最強大的Grace超級芯片。

Blackwell新架構(gòu)代表了迄今為止功能最強大的AI芯片架構(gòu)!擁有2080億個晶體管的GPU,定制臺積電4nm工藝制造,通過NVLink連接實現(xiàn)高速通信;運行實時生成式AI,在萬億參數(shù)級的大型語言模型(LLM)的成本和能耗較前代改善25倍

圖:黃仁勛右手舉著Blackwell,左手舉著Hopper GH100 GPU;圖源:GTC大會

這是塊非常非常大的GPU!”黃仁勛談道,他對著尺寸比較大顆的Hopper GH100 GPU打趣地說“沒關(guān)系,你很棒,很棒的成長”。

正如此前外媒DigiTimes爆料,Blackwell架構(gòu)GB200之所以這么“大”,是因為這是英偉達首個采用MCM(多芯片封裝)設(shè)計的GPU,在同一個芯片上集成了兩個GPU。

據(jù)了解,GB200驅(qū)動系統(tǒng)可通過新Quantum-X800網(wǎng)絡(luò)獲得800Gb/s超高速網(wǎng)絡(luò)。此外,英偉達還推出GB200 NVL72液冷機架級系統(tǒng),集成36個Grace Blackwell超級芯片,與傳統(tǒng)H100 GPU相比,在大模型推理上可提升30倍性能。,時長00:20

圖:Blackwell架構(gòu)

新一代SuperPOD超算 撐起百萬億參數(shù)模型想象力

隨著AI對全領(lǐng)域的滲透和算力加緊加急部署,不斷變化的項目需求使得互聯(lián)網(wǎng)公司正在謀求一種更加安全、便捷、大規(guī)模、可擴展、數(shù)據(jù)可隔離的集群式解決方案。

在本屆GTC大會上全新升級的 DGX SuperPoD,也為企業(yè)對u萬億模型的探索提供了一份極其重要的保障。

英偉達基于GB200系統(tǒng),發(fā)布新一代DGX SuperPOD超級計算機平臺,采用液冷設(shè)計,提供11.5 exaflops AI運算能力。

DGX SuperPOD是專門為AI量身定制的大規(guī)模、安全、可擴展的超級計算機。可擴展至數(shù)萬個GB200超級芯片,并透過NVLink連接576個Blackwell GPU,獲取龐大共享內(nèi)存。該平臺具備智能管理和持續(xù)運行能力,將極大推進大規(guī)模生成式AI的部署。

圖:SuperPOD;圖源:GTC大會

除SuperPOD外,英偉達也推出DGX GB200系統(tǒng),提供144 petaflops AI性能、1.4TB GPU內(nèi)存,且比上代快15倍。B200支持DGX SuperPOD配置,為企業(yè)部署AI提供彈性。

入局具身智能 發(fā)布多模態(tài)AI項目GR00T

當AI大模型有了身體,會是什么樣?從Figure 01身上已隱約可見人類與AI共存的未來

在今天的GTC大會中,英偉達還公布了人形機器人項目GR00T。黃仁勛展示了多個由GR00T驅(qū)動的人形機器人如何任務(wù),包括來自Agility Robotics、Apptronik、傅利葉智能(Fourier Intelligence) 和宇樹科技(Unitree Robotics)的機器人產(chǎn)品。亮點有:

▌使用其數(shù)位孿生技術(shù),讓機器人可以在虛擬世界不會摔斷腿就可以學會走路、揮手

▌英偉達將會提供Robotic Foundation Model,加速機器人時代來臨

GR00T于英偉達的Isaac機器人平臺工具,基于新的通用基礎(chǔ)模型,GR00T 驅(qū)動的人形機器人能夠接受文本、語音、視頻甚至現(xiàn)場演示的輸入,并對其進行處理以采取特定的操作,包括理解自然語言、模擬人類行為、在現(xiàn)實世界中導(dǎo)航和交互。英偉達還開發(fā)了一種新型“機器人大腦”計算芯片 Jetson Thor,能夠執(zhí)行復(fù)雜的任務(wù)并使用 Transforme 引擎處理多個傳感器。

人形機器人賽道近期達到了一個新的火熱程度,正如黃仁勛所說“機器人的ChatGPT時刻可能即將到來”。

結(jié)語

當黃仁勛又很淡定的在自家廚房里開完了GTC發(fā)布會,我們知道這場“AI核彈”轟炸的影響將一直持續(xù)下去。

“通用計算已經(jīng)失去動力,現(xiàn)在我們需要更大的模型,我們需要更大的GPU,更需要將GPU堆疊在一起。”黃仁勛說道。“這不是為了降低成本,而是為了擴大規(guī)模?!盙B200預(yù)計將在今年晚些時候發(fā)貨。

隨著AI對全領(lǐng)域的滲透,英偉達超級芯片Blackwell、超算SuperPOD、人形機器人項目GR00T等產(chǎn)品的發(fā)布,使得造萬億模型獲獎成為可能,甚至打開了通往十萬億,乃至更大想象力算力AI模型探索的潘多拉魔盒。?

參考鏈接:https://www.nvidia.cn/gtc-global/keynote/

*關(guān)于「算力豹」,微信公眾號搜索:dethinktank

分享到

yunlang

相關(guān)推薦