今年GTC( GPU Technology Conoference,)會議期間,最值得關(guān)注的無疑是NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛對未來的洞見,考慮到以Chat GPT為代表的生成式AI的非凡表現(xiàn),因此,黃仁勛的見解、觀察更值得關(guān)注。
“曲速引擎”背后的源動力
“我們正處于AI的 iPhone時刻 ”,他說。
他把AI比喻為“曲速引擎”源動力。所謂的曲速引擎,就是一種利用空間扭曲進(jìn)行移動引擎,是一種超光速(faster-than-light,F(xiàn)TL)的推進(jìn)系統(tǒng)。在科幻小說《三體》中,程心就是借助曲速引擎驅(qū)動飛船,逃脫末日崩塌的。
對于AI的這些溢美之詞是預(yù)料中的事情。但是黃先生著重強(qiáng)調(diào)了其背后的支撐技術(shù)。
黃仁勛表示,類似ChatGPT大型語言模型(LLM)的部署是一個重要的全新推理工作負(fù)載。為了支持像ChatGPT這樣的大型語言模型推理,黃仁勛發(fā)布了一款新的GPU——帶有雙GPU NVLink的H100 NVL。
基于NVIDIA Hopper架構(gòu)的H100配有一個Transformer引擎,旨在處理驅(qū)動ChatGPT的類似GPT模型。與用于GPT-3處理的HGX A100相比,配備四對H100與雙GPU NVLink的標(biāo)準(zhǔn)服務(wù)器的速度最高可達(dá)10倍。
黃仁勛表示:“H100可以將大型語言模型的處理成本降低一個數(shù)量級。”
此外,黃仁勛還提到了Grace CPU,通過900GB/s高速芯片對芯片的接口,NVIDIA Grace Hopper超級芯片可連接Grace CPU和Hopper GPU。黃仁勛解釋說,“ Grace Hopper是處理超大型數(shù)據(jù)集的理想選擇,比如用于推薦系統(tǒng)的AI數(shù)據(jù)庫和大型語言模型?!薄翱蛻粝M麡?gòu)建規(guī)模大幾個數(shù)量級的AI數(shù)據(jù)庫,那么Grace Hopper是最理想的引擎?!?/p>
最新版本的DGX搭載8個NVIDIA H100 GPU,它們連接成為一個巨大的GPU。黃仁勛表示:“NVIDIA DGX H100是全球客戶構(gòu)建AI基礎(chǔ)設(shè)施的藍(lán)圖”,現(xiàn)已全面投入生產(chǎn)。
在云的時代,用戶當(dāng)然可以透過多云來獲得所需要的計算資源。為此,NVDIA與Oracle、亞馬遜、Azure等多云服務(wù)商達(dá)成了一系列的合作。
不僅如此,黃仁勛發(fā)布了NVIDIA AI Foundations云服務(wù)系列,其中NeMo自定義語言文本-文本轉(zhuǎn)換生成模型、Picasso視覺語言模型,以及BioNeMo藥物研發(fā)模型等,深化行業(yè)AI的應(yīng)用和落地。
生成式AI在明,Omniverse在暗
當(dāng)生成式AI的光芒太過耀眼的時候,Omniverse的價值就會被淡忘并忽略。為此,NVDIA用一系列行動來傳遞Omniverse的價值。
黃仁勛宣布,NVIDIA 正在與微軟合作,將 NVIDIA Omniverse Cloud 這一完全托管的云服務(wù)引入全球各行各業(yè),并推出又一項云服務(wù)以加速企業(yè)實現(xiàn)前所未有的模擬和協(xié)作能力。為了展示Omniverse在3D設(shè)計協(xié)作、數(shù)字孿生模擬的突出價值,黃仁勛分享了一段視頻,展示了NVIDIA Isaac Sim如何通過完全保真的數(shù)字孿生,幫助亞馬遜倉庫機(jī)器人Proteus改進(jìn)動作編排。
黃仁勛深入介紹了Omniverse在3萬億美元汽車產(chǎn)業(yè)數(shù)字化中的作用,如Lotus正在使用Omniverse以虛擬方式組裝焊接站;梅賽德斯-奔馳使用Omniverse為新車型建立、優(yōu)化和規(guī)劃裝配線;Rimac和Lucid Motors在Omniverse上使用真實設(shè)計數(shù)據(jù)創(chuàng)建數(shù)字商店;寶馬與Idealworks合作,使用Omniverse中的Isaac Sim生成訓(xùn)練工廠機(jī)器人的合成數(shù)據(jù)和場景;比亞迪也在使用NVIDIA DRIVE Orin 集中式計算平臺擴(kuò)展其更廣泛的車型。
電信巨頭AT&T采用NVIDIA AI,以實現(xiàn)更高效地數(shù)據(jù)處理。同時,他們正在測試Omniverse ACE和Tokkio AI虛擬化身工作流為客服部門及其員工幫助臺建立、定制和部署虛擬助手。
美國運(yùn)通、美國郵政署、Microsoft Office和Teams以及亞馬遜等4萬家客戶都在使用高性能的NVIDIA TensorRT推理優(yōu)化器和運(yùn)行時,以及多框架數(shù)據(jù)中心推理服務(wù)軟件NVIDIA Triton。Uber 使用 Triton 實現(xiàn)每秒為數(shù)十萬車輛預(yù)測到達(dá)時間,擁有超過6000萬日活用戶的Roblox使用Triton提供游戲推薦模型、構(gòu)建頭像、審核內(nèi)容和市場廣告。
微軟、騰訊和百度都在使用NVIDIA CV-CUDA實現(xiàn)AI計算機(jī)視覺,這項目前處于公測階段的技術(shù)可優(yōu)化前處理和后處理,節(jié)省4倍成本和能耗。
黃仁勛宣布, NVIDIA cuLitho將助力ASML、TSMC和Synopsis等半導(dǎo)體領(lǐng)導(dǎo)者加速新一代芯片的設(shè)計和制造。
小結(jié)
生成式AI在明,Omniverse在暗,一明一暗勾勒出AI改變世界的格局。AI正在助力全球完成不可能的任務(wù)。
千萬不要只見樹木,不見森林!