老黃:

女士們,先生們,我有一位非常特別的嘉賓。請大家坐下,我們即將開始。

我的下一位嘉賓給我留下了深刻的印象,原因有三。首先,只有少數(shù)企業(yè)家和創(chuàng)始人能夠創(chuàng)辦一家真正影響全球數(shù)十億人生活的公司,發(fā)明服務,并成為一家最先進的計算公司。其次,很少有企業(yè)家和創(chuàng)始人能夠創(chuàng)立一家市值超過一萬億美元的公司。第三,他是一位大學輟學生。這三件事同時成立。

女士們,先生們,請歡迎馬克·扎克伯格。

馬克,歡迎你第一次參加 SIGGRAPH。你能相信嗎?作為計算的先驅(qū)之一,現(xiàn)代計算的推動者,我不得不邀請他參加 SIGGRAPH。馬克,請坐。很高興你能來,感謝你飛過來。

小扎:

是的,這會很有趣。我聽說你已經(jīng)走了五個小時了?

老黃:

是的,當然。這就是 SIGGRAPH,90% 的參與者都是博士。SIGGRAPH 的偉大之處在于,它是計算機圖形學、圖像處理、人工智能和機器人技術(shù)的結(jié)合。多年來,一些公司在這里展示了令人驚嘆的成果,包括迪士尼、皮克斯、Adobe、Epic Games,當然還有 NVIDIA,我們在這里做了很多工作。今年,我們在人工智能和模擬的交叉點上發(fā)表了 20 篇論文。我們正在使用人工智能來幫助模擬變得更大規(guī)模、更快,例如可微分物理。我們還在使用模擬來創(chuàng)建用于人工智能合成數(shù)據(jù)生成的模擬環(huán)境。這兩個領(lǐng)域真的走到了一起,我們?yōu)槲覀冊谶@里所做的工作感到自豪。

在 Meta,你們做了令人驚嘆的人工智能工作。我覺得有趣的是,當媒體報道 Meta 近年來如何進軍人工智能領(lǐng)域時,提到了 FAIR 所做的工作。記住,我們都使用來自 Meta 的 PyTorch。你們在計算機視覺、語言模型、實時翻譯方面所做的工作都是開創(chuàng)性的。我想問的第一個問題是,您如何看待 Meta 當今生成式人工智能的進步?您如何應用它來增強運營或引入新功能?

小扎:

是的,有很多內(nèi)容需要解答。首先,很高興來到這里。Meta 在 SIGGRAPH 工作了八年,所以與大家相比,我們是菜鳥。我記得那是在 2018 年,我們展示了一些早期的 VR 和混合現(xiàn)實頭戴設(shè)備的手勢追蹤工作。我們在編解碼器頭像方面取得了顯著進展,希望通過消費者頭戴設(shè)備實現(xiàn)照片級逼真的頭像,這一目標越來越近了。對此我感到非常興奮。

此外,我們還在顯示系統(tǒng)方面完成了許多工作。一些未來的原型和研究旨在使混合現(xiàn)實頭顯變得非常薄,但需要相當先進的光學堆棧和顯示系統(tǒng),即集成系統(tǒng)。這些通常是我們首先展示的內(nèi)容。因此,今年我很高興能來到這里,不僅僅是談論 Metaverse 的內(nèi)容,還有所有的人工智能部分。

在創(chuàng)辦 Reality Labs 之前,我們創(chuàng)辦了 FAIR,即人工智能研究中心,當時是 Facebook,現(xiàn)在是 Meta。我們在這個領(lǐng)域已經(jīng)工作了一段時間。圍繞生成式人工智能(Gen AI)的所有內(nèi)容,都是一場有趣的革命。我認為它最終會以有趣的方式改變我們所有不同產(chǎn)品的運作方式。

我們已經(jīng)擁有一系列大型產(chǎn)品,如 feed 和推薦系統(tǒng),以及 Instagram 和 Facebook 等。我們不再僅僅是為了與朋友聯(lián)系。排名一直很重要,因為即使你只是關(guān)注朋友,如果有人做了一些非常重要的事情,比如你的表弟生了孩子,你希望它出現(xiàn)在最上面。如果它被埋在信息流的某個地方,你會很生氣。因此,排名很重要。

在過去幾年里,情況已經(jīng)發(fā)展到更多的內(nèi)容是公開的。推薦系統(tǒng)變得非常重要,因為現(xiàn)在不僅僅是幾百或幾千個來自朋友的潛在候選帖子,而是數(shù)百萬條內(nèi)容。這變成了一個非常有趣的推薦問題。

有了生成式人工智能,我認為我們將很快進入一個新領(lǐng)域:你今天在 Instagram 上看到的大部分內(nèi)容不僅是從世界上符合你興趣的內(nèi)容中推薦給你的,不管你是否關(guān)注這些人。我認為在未來,很多這樣的內(nèi)容也將使用這些工具來創(chuàng)建。一些將是創(chuàng)作者使用工具來創(chuàng)建新內(nèi)容,另一些將是為你即時創(chuàng)建的內(nèi)容,或者通過現(xiàn)有的不同事物匯集和合成的內(nèi)容。

這是我們正在做的事情的核心部分將如何發(fā)展的一個例子。它已經(jīng)發(fā)展了 20 年,但我認為這將繼續(xù)發(fā)展。

老黃:

很少有人意識到世界上有史以來最大的計算系統(tǒng)之一是推薦系統(tǒng)。

小扎:

這是一條完全不同的道路,并不完全是人們談論的那種生成式人工智能熱點,但它與建立越來越多的通用模型類似。

推動質(zhì)量改進的一大因素是過去對每種類型的內(nèi)容都有不同的模型。最近的一個例子是,我們有一個模型用于對卷軸進行排名和推薦,另一個模型用于對更長視頻進行排名和推薦。為了使系統(tǒng)能夠在線顯示任何內(nèi)容,還需要進行一些產(chǎn)品工作。然而,你創(chuàng)建的通用推薦模型越多,它就會變得越好。這部分原因在于內(nèi)容的經(jīng)濟學和流動性。你可以從中獲取的內(nèi)容池越廣,就不會遇到從不同池中獲取內(nèi)容的低效率問題。隨著模型變得越來越大、越來越通用,情況會變得越來越好。

我夢想有一天,整個 Facebook 或 Instagram 都像一個單一的 AI 模型,將所有不同的內(nèi)容類型和系統(tǒng)統(tǒng)一在一起。這些內(nèi)容類型和系統(tǒng)在不同的時間范圍內(nèi)有不同的目標,有些只是向你展示你今天想要看到的有趣內(nèi)容,而有些則幫助你長期建立你的網(wǎng)絡,比如你可能認識的人或你可能想要關(guān)注的賬戶。

老黃:

這些多模態(tài)模型往往更擅長識別模式和弱信號。

AI 在你的公司中如此深入,真是太有趣了。你一直在構(gòu)建 GPU 基礎(chǔ)設(shè)施,運行這些大型推薦系統(tǒng)?,F(xiàn)在,我有點慢,實際上是在 GPU 方面。是的,我試圖表現(xiàn)得友善。你知道嗎?你是我的客人。

小扎:

在我來這里之前,你在后臺談論承認自己的錯誤或諸如此類的事情,所以你不必突然主動這么做。就好像被這篇帖子批評了一段時間一樣。但是一旦你進入這個狀態(tài),你就會變得堅強。

老黃:

生成式人工智能最酷的地方在于,當我使用 WhatsApp 時,我感覺自己正在與 WhatsApp 合作。我喜歡 Imagine。我坐在這里打字,它會在我打字時生成圖像。我回去改一下措辭,它會生成其他圖像。比如,日落時分,一位中國老人和三只狗(金毛獵犬、金毛貴賓犬和伯爾尼山犬)一起享用一杯威士忌,它生成了一張非常漂亮的圖片。是的,每個月都在進步。這是上周的情況。對此非常興奮。

小扎:

現(xiàn)在,想象一下我。過去一周我花了很多時間和我的女兒們在一起,想象她們是美人魚之類的。這很有趣。很多新一代人工智能的東西將會是對我們長期以來擁有的所有工作流程和產(chǎn)品的重大升級。同時,現(xiàn)在將會有所有這些全新的東西可以被創(chuàng)造出來。因此,META AI,即在我們的世界中擁有一個能夠幫助你完成不同任務的人工智能助手的想法將非常具有創(chuàng)造性,就像你說的。但它們非常通用,所以你不需要僅僅將其限制在那里。它將能夠回答任何問題。

我認為,隨著時間的推移,當我們從 Llama 3 類模型轉(zhuǎn)向 Llama 4 及更高版本時,它將不再像聊天機器人那樣,你給它一個提示,它就會做出反應。然后你給它一個提示,它就會做出反應,就像來回一樣。我認為它會很快進化,你給它一個意圖,它實際上可以在多個時間范圍內(nèi)消失。它可能應該承認你事先給了它一個意圖。但我認為有些東西最終會啟動,計算需要數(shù)周或數(shù)月的時間,然后當世界上發(fā)生某些事情時才返回給你。我認為這會非常強大。

老黃:

今天的人工智能,如你所知,是回合制的。你說些什么,它會回應你些什么。但顯然,當我們思考時,當我們被賦予任務或問題時,我們會考慮多種選擇,或者我們會想出一個選項樹,一個決策樹,然后我們沿著決策樹走下去,在腦海中模擬我們可能做出的每個決定的不同結(jié)果。所以我們在做規(guī)劃。在未來,人工智能也會做同樣的事情。

當你談到你對創(chuàng)造者人工智能的愿景時,我非常興奮的一件事,坦率地說,我認為這是一個本壘打的想法。告訴大家關(guān)于創(chuàng)造者人工智能和人工智能工作室的信息,它們將使你能夠做到這一點。

小扎:

是的,所以我們實際上……這是我們討論過的事情,我們今天要把它推廣得更廣泛。我們的很多愿景是……我不認為會只有一個人工智能模型,業(yè)內(nèi)其他一些公司也這么做,他們正在構(gòu)建一個中央代理。是的,我們將提供 MetAI 助手供您使用。但我們的愿景是,我們希望讓所有使用我們產(chǎn)品的人都能為自己創(chuàng)建代理。因此,無論是平臺上的數(shù)百萬創(chuàng)作者,還是數(shù)億小企業(yè),我們最終都希望能夠整合您的所有內(nèi)容,并快速建立業(yè)務代理,以便與您的客戶互動,做銷售和客戶支持等等。

所以我們現(xiàn)在開始推出的更多產(chǎn)品是我們稱之為 AI Studio 的產(chǎn)品。它基本上是一套工具,最終將使每個創(chuàng)作者都可以構(gòu)建自己的 AI 版本,作為他們的社區(qū)可以與之互動的代理或助手。這里有一個根本問題,就是一天中的時間不夠用,如果你是一個創(chuàng)作者,你想更多地與你的社區(qū)互動,但你的時間有限。同樣,你的社區(qū)也想與你互動,但這很難,這樣做的時間有限。所以下一個最好的事情是允許人們基本上創(chuàng)造這些工件,它有點像一個代理,但你需要訓練它在你的材料上以你想要的方式代表你。我認為這是一種非常有創(chuàng)造性的努力,幾乎就像你在那里展示的一件藝術(shù)品或內(nèi)容。很明顯,這種技術(shù)不會與創(chuàng)作者本身直接互動,但我認為這會是一種有趣的方式,就像創(chuàng)作者在社交平臺上發(fā)布內(nèi)容一樣,代理也可以這樣做。

我認為,人們會為各種不同的用途創(chuàng)建自己的代理。有些代理將是某種定制的實用程序,用戶希望通過微調(diào)和訓練來完成特定任務。另一些代理則會用于娛樂,人們創(chuàng)造的一些東西可能很有趣,雖然有點傻,但以不同的方式展現(xiàn)了有趣的態(tài)度。我們可能不會將這些構(gòu)建為META AI的助手,但我認為人們非常有興趣看到和互動。

一個有趣的用例是人們使用這些代理來提供支持。讓我有點驚訝的是,META AI的主要用例之一是人們用它來模擬他們將要遇到的困難社交場合。無論是在專業(yè)場合,比如詢問經(jīng)理如何獲得晉升或加薪,還是在個人生活中,比如與朋友吵架或與女朋友遇到困難情況,這些代理提供了一個完全沒有判斷力的區(qū)域,用戶可以在其中扮演角色,看看談話會如何進行,并獲得反饋。

然而,很多人不想只與同一種代理互動,無論是META AI還是聊天GPT,還是其他人都在使用的代理。他們希望創(chuàng)造自己的代理。這就是我們對AI Studio的目標之一,但這也是我們更大觀點的一部分,即我們不應該只有一個與人們交互的大型AI。我們認為,如果這些不同的代理多樣化,世界將會變得更好、更有趣。

老黃:

如果你是一名藝術(shù)家,你可以將你的風格和所有作品拿出來,對其中一個模型進行微調(diào),使其成為一個人工智能模型。然后,你可以提示它按照你的藝術(shù)風格創(chuàng)作一些東西,甚至可以給它一幅畫或素描作為靈感,它可以為你創(chuàng)作一些東西。未來,每家餐館、每個網(wǎng)站都可能擁有這些人工智能。

小扎:

我認為,在未來,就像每個企業(yè)都有一個電子郵件地址、一個網(wǎng)站和一個社交媒體賬戶一樣,每個企業(yè)都會有一個與客戶互動的人工智能代理。從歷史上看,有些事情很難做到。比如,客戶支持部門通常是與銷售部門分開的組織,而這并不是CEO希望的運作方式。雖然它們是不同的技能,但你正在建立這些大型系統(tǒng)。

我想,當你是 CEO 時,你必須做所有的事情。但當你將抽象概念融入組織時,很多時候組織是分開的,因為它們針對不同事物進行了優(yōu)化。

我認為,柏拉圖式的理想是,它是一回事。作為客戶,你其實并不關(guān)心。當你試圖購買某樣東西時,你不希望有一條不同的路線,而當你購買的東西有問題時,你又不希望有一條不同的路線。你只是希望有一個地方可以回答你的問題,并能夠以不同的方式與企業(yè)互動。我認為這也適用于創(chuàng)作者。個人消費者方面將是與客戶的所有互動,尤其是他們的投訴,將使你的公司變得更好。

老黃:

事實上,這一切都與人工智能有關(guān),這將捕捉機構(gòu)知識和方法,所有這些都可以用于分析,從而改進人工智能等等。

小扎:

所以我認為這個商業(yè)版本有更多的集成,我們?nèi)匀惶幱谙喈斣缙诘?alpha 階段。但是 AI 工作室讓人們可以創(chuàng)建他們的 UGC 代理和不同的東西,并開始讓創(chuàng)作者創(chuàng)建它們的飛輪。我對此非常興奮。

老黃:

那么我可以使用 AI 工作室來微調(diào)我的圖像集合嗎?

小扎:是的,我們會到達那里。

老黃:然后我可以把我寫的所有東西都加載進去,這樣你就可以把它當作我的抹布嗎?

小扎:

是的,基本上。然后每次我回到它時,它都會再次加載它的內(nèi)存。所以它會記得上次停在哪里,我們繼續(xù)我們的對話,好像什么都沒發(fā)生過一樣。

就像任何產(chǎn)品一樣,它會隨著時間的推移變得更好。訓練它的工具會變得更好。這不僅僅是你想讓它說什么。我認為一般來說,創(chuàng)作者和企業(yè)也有一些他們想避開的話題,所以只是在所有這些方面做得更好。我認為這的柏拉圖式版本不僅僅是文本,您幾乎只希望能夠做到這一點,然后這與我們長期以來所做的某些編解碼器化身工作有所交集。您希望能夠與經(jīng)紀人進行視頻聊天。我認為隨著時間的推移,我們會實現(xiàn)這一目標。我認為這些事情并不遙遠,但飛輪旋轉(zhuǎn)得非常快。所以這很令人興奮。有很多新東西需要構(gòu)建。

即使基礎(chǔ)模型的進展現(xiàn)在停止了(但我認為不會停止),我們也會有五年的時間讓行業(yè)進行產(chǎn)品創(chuàng)新,基本上弄清楚如何最有效地利用迄今為止已經(jīng)建成的所有東西。但實際上我認為基礎(chǔ)模型和基礎(chǔ)研究的進展正在加速。所以,這是一段相當瘋狂的時光。

您的愿景……正是您讓這一切成為了現(xiàn)實。

老黃:

在上次談話中,我……謝謝。我們是首席執(zhí)行官,也是嬌嫩的花朵。是的,我們需要很多后衛(wèi)。我們現(xiàn)在相當灰白了。我想我們是這個行業(yè)中最資深的兩位創(chuàng)始人,這是真的。

小扎:這是真的。你的頭發(fā)變白了,我的頭發(fā)卻變長了。

老黃:我的頭發(fā)變灰了,你的頭發(fā)變卷了。這是怎么回事?

小扎:它一直是卷曲的,這就是我把它剪短的原因。

老黃:是的,如果我知道要花這么長時間才能成功,我根本就不會開始。不,我會像你一樣輟學,搶占先機。

小扎:這就是我們性格之間的很大差異。我認為這些事情……

老黃:

你已經(jīng)領(lǐng)先了12年。那非常好。你做得很好。

我喜歡你的愿景,即每個人都可以擁有人工智能,每個企業(yè)都可以擁有人工智能。在我們公司,我希望每個工程師和每個軟件開發(fā)人員都擁有一個人工智能,或者許多人工智能。我喜歡你的愿景,因為你也相信每個人、每家公司都應該能夠創(chuàng)造自己的人工智能。所以你們實際上已經(jīng)開源了。當你開源Llama時,我認為這很棒。

順便說一下,Llama 2.1,我認為Llama 2可能是去年人工智能領(lǐng)域最大的事件。

小扎:原因是,我以為是H100,但它是……

老黃:這是一個先有雞還是先有蛋的問題。是啊,哪個先出現(xiàn)?

小扎:H100。Llama 2實際上并不是H100,是A100。

老黃:

是的,謝謝。

但我之所以說它是最大的事件,是因為當它出現(xiàn)時,它激活了每個公司、每個企業(yè)和每個行業(yè)。突然之間,每家醫(yī)療保健公司都在開發(fā)人工智能,每家公司都在開發(fā)人工智能,每家大公司、小公司、初創(chuàng)公司都在開發(fā)人工智能。這使得每個研究人員都能夠再次參與人工智能,因為他們有一個可以做某事的起點。

現(xiàn)在3.1已經(jīng)發(fā)布,令人興奮的是,我們共同努力部署3.1。我們正在將其推廣至全球企業(yè),興奮程度簡直無以言表。我認為它將支持各種應用。

但請告訴我您的開源理念。這是從哪里來的?而且你開源了PyTorch?,F(xiàn)在它已經(jīng)成為了人工智能實現(xiàn)的框架。現(xiàn)在您已經(jīng)開源了Llama 3.1或Lama。圍繞它建立了整個生態(tài)系統(tǒng)。所以我認為這太可怕了,但這一切是從哪里來的呢?

小扎:

是的,這方面有很多歷史。我們長期以來已經(jīng)做了很多開源工作。我認為部分原因在于,坦白地說,我們是在其他一些科技公司之后起步的,構(gòu)建分布式計算基礎(chǔ)設(shè)施和數(shù)據(jù)中心之類的東西。正因為如此,當我們制造出這些東西的時候,它已經(jīng)不具備競爭優(yōu)勢了。我們想,好吧,我們不妨把它公開,然后我們將受益于周圍的生態(tài)系統(tǒng)。因此我們有很多這樣的項目。

我認為最大的一個可能是開放計算,我們將服務器設(shè)計、網(wǎng)絡設(shè)計以及最終的數(shù)據(jù)中心設(shè)計都發(fā)布在這里。通過將其打造成為某種行業(yè)標準,所有供應鏈基本上都圍繞它進行組織,這樣做的好處是每個人都能省錢。因此,通過將其公開,我們基本上已經(jīng)節(jié)省了數(shù)十億美元的資金。Open Compute 也使得我們?yōu)橐粋€數(shù)據(jù)中心設(shè)計的 NVIDIA HGX 突然可以在每個數(shù)據(jù)中心運行。

老黃:這是一次非常棒的經(jīng)歷。

小扎:

我們已經(jīng)使用一系列基礎(chǔ)設(shè)施工具完成了這項工作,比如 React、PyTorch。因此我想說,當 Llama 出現(xiàn)時,我們已經(jīng)積極地傾向于這樣做了。具體來說,對于人工智能模型,我想我可以從幾個方面來看待這個問題。

一是,過去 20 年在公司里創(chuàng)造東西真的很有趣。最困難的事情之一就是我們必須通過競爭對手的移動平臺發(fā)布我們的應用程序。一方面,移動平臺給該行業(yè)帶來了巨大的福音,這真是太棒了。另一方面,必須通過競爭對手來交付產(chǎn)品,這很有挑戰(zhàn)性。在我成長的那個時代,F(xiàn)acebook 的第一個版本是在網(wǎng)絡上的,它是開放的。隨著向移動設(shè)備的過渡,好處是現(xiàn)在每個人的口袋里都有一臺電腦,這太棒了。缺點是,我們能做的事情受到了很大限制。

當你觀察這幾代計算技術(shù)時,就會發(fā)現(xiàn)存在著巨大的近因偏差,每個人都只關(guān)注移動設(shè)備,并認為,因為封閉的生態(tài)系統(tǒng),因為蘋果基本上贏了,并設(shè)定了其條款。是的,我知道從技術(shù)上來說 Android 手機的數(shù)量更多,但蘋果基本上占據(jù)了整個市場并獲得了所有的利潤。基本上,Android 在開發(fā)方面是在追隨蘋果的。所以我認為蘋果顯然贏得了這一代產(chǎn)品。

但情況并不總是這樣。如果你回顧上一代,蘋果當時在做他們那種封閉的事情,但微軟,它顯然不是一個完全開放的公司,但與蘋果相比,Windows 在所有不同的 OEM 和不同的軟件上運行,不同的硬件,是一個更加開放的生態(tài)系統(tǒng)。Windows 是領(lǐng)先的生態(tài)系統(tǒng)?;旧希?PC 時代,開放的生態(tài)系統(tǒng)贏得了勝利。我希望在下一代計算中,我們能夠回到開放生態(tài)系統(tǒng)獲勝并再次占據(jù)領(lǐng)先地位的區(qū)域??偸菚幸粋€封閉的和一個開放的。我認為同時做這兩件事都是有理由的,兩者各有各的好處。在這一點上,我并不像一個狂熱分子。我們做的是閉源的東西,我們所發(fā)表的并不是所有的東西都是開放的。但我認為,總體而言,對于整個行業(yè)所構(gòu)建的計算平臺而言,如果軟件是開放的,那么將具有很大的價值。這確實塑造了我的哲學觀念。

對于 Llama 的人工智能以及我們在 AR 和 VR 領(lǐng)域所做的工作,我們基本上是在開發(fā)用于混合現(xiàn)實的 Horizon OS,它是一種開放的操作系統(tǒng),類似于 Android 或 Windows,基本上就是為了讓我們能夠與許多不同的硬件公司合作來制造各種不同的設(shè)備。我們基本上只是想讓生態(tài)系統(tǒng)恢復到開放的水平。我非常樂觀地認為,在下一代中,開放的將會獲勝。

對于我們來說,我只是想確保我們能夠獲得,這有點自私,但在建立了這家公司一段時間之后,我未來 10 年或 15 年的計劃之一就是確保我們能夠建立基礎(chǔ)技術(shù),我們將在此基礎(chǔ)上構(gòu)建社交體驗。因為我嘗試構(gòu)建的東西太多了,然后被告知,不,你不能真正由平臺提供商在某種程度上構(gòu)建這一點,我只是想,不,去他的。對于下一代,我們要一路走下去…

老黃:確保我們擁有廣播機會。嗶… (笑指小扎前面粗言)

小扎:抱歉。對不起。我們大概 20 分鐘內(nèi)一切都還好,但是當我談論封閉的平臺時我就會生氣。

老黃:

嘿,看,很棒。我認為這是一個美好的世界,有人致力于構(gòu)建最好的人工智能,不管他們?nèi)绾螛?gòu)建它,并將其作為服務提供給世界。但是如果你想構(gòu)建自己的人工智能,你仍然可以構(gòu)建自己的人工智能。

所以能力——是的,完全是。要使用人工智能,有很多事情要做。我不想自己做這件夾克。我更希望有人為我量身定做這件夾克。你知道我在說什么?是的。是的。但皮革可以開源這一事實對我來說不是一個有用的概念。但我認為,如果你能擁有優(yōu)質(zhì)的服務、令人難以置信的服務以及開放的能力,那么我們基本上就擁有了整個范圍。

但是 3.1 的真正偉大之處在于您有 405B、70B、8B。您可以用它來生成合成數(shù)據(jù),使用較大的模型來實質(zhì)上教導較小的模型。盡管較大的模型會更加通用,更不易碎,但您仍然可以構(gòu)建一個較小的模型,以適應您想要的任何操作領(lǐng)域或運營成本。

我想,你遇見了一名警衛(wèi)。是的,Llamaguard。Llamaguard 用于護欄,太棒了。所以現(xiàn)在,您構(gòu)建模型的方式是透明的。它有,你奉獻,你有一個世界一流的安全團隊,世界一流的道德團隊。您可以以這樣一種方式構(gòu)建它,讓每個人都知道它已正確構(gòu)建。所以我真的很喜歡它的這個部分。

小扎:

在我被 岔開話題之前,我確實認為存在這種一致性。我們構(gòu)建它是因為我們希望這個東西存在,并將它從某個封閉的模型中剔除出去。但這不僅僅是一個可以構(gòu)建的軟件,還需要一個圍繞它的生態(tài)系統(tǒng)。因此,如果我們不開源它,它幾乎就無法很好地運行。

我們這樣做并不是因為我們是利他主義者,盡管我認為這對生態(tài)系統(tǒng)是有幫助的。我們這樣做是因為我們認為通過在其周圍建立一個強大的生態(tài)系統(tǒng),這將使我們正在構(gòu)建的東西變得最好??纯从卸嗌偃藶?PyTorch 生態(tài)系統(tǒng)做出了貢獻。

老黃:

是的,完全正確。大量的工程。僅 NVIDIA 一家,我們可能就有幾百人致力于讓 PyTorch 變得更好、更具可擴展性、性能更強等等。

小扎:

當某種東西成為行業(yè)標準時,其他人就會去解決它,因此,系統(tǒng)中的所有硅片最終都將得到優(yōu)化,以便很好地運行這個系統(tǒng),這將使每個人受益,但它也將與我們正在構(gòu)建的系統(tǒng)配合良好。我認為,這只是其中一個例子,說明這種方法最終確實非常有效。所以,我認為開源策略將是一個很好的商業(yè)策略。我認為人們?nèi)匀徊惶靼走@一點。

老黃:

我們非常喜歡它,并圍繞它建立了一個生態(tài)系統(tǒng)。我們建造了這個叫做 AI Foundry 的東西。

小扎:

你們在這方面做得非常棒。每次我們發(fā)布新產(chǎn)品時,你們總是第一個發(fā)布、優(yōu)化并使其正常運行。所以,我很感激,但是我能說什么呢?我們有優(yōu)秀的工程師。而且你們總是能很快地開始做這些事情。

老黃:

我是一名老年人,但我很敏捷。這就是首席執(zhí)行官必須要做的事。

我認識到一件重要的事情。我認為 Llama 確實很重要。我們構(gòu)建了這個概念,稱之為 AI Foundry,以便我們可以幫助每個人構(gòu)建、采取行動。很多人都有構(gòu)建人工智能的愿望。對他們來說,擁有人工智能非常重要,因為一旦他們將其放入飛輪、數(shù)據(jù)飛輪中,他們公司的機構(gòu)知識就會被編碼并嵌入到人工智能中。所以,他們無法承受將人工智能飛輪、數(shù)據(jù)飛輪和經(jīng)驗飛輪放在其他地方。因此,開源允許他們這樣做,但他們并不真正知道如何將整個東西變成人工智能。

因此,我們創(chuàng)建了所謂的“AI Foundry”。我們提供工具、提供專業(yè)知識、Llama 技術(shù),我們有能力幫助他們將整個事情轉(zhuǎn)變?yōu)?AI 服務。然后,當我們完成這些之后,他們就拿走它,擁有它,它的輸出就是我們所說的 NIM。用戶只需下載 Neural Micro NVIDIA 推理微服務(NIM),并在任何他們喜歡的地方運行,包括本地環(huán)境。我們擁有一個完整的合作伙伴生態(tài)系統(tǒng),從可以運行 NIM 的 OEM 到像埃森哲這樣的全球系統(tǒng)集成商(GSI)。我們對這些 GSI 進行了培訓并與其合作,以創(chuàng)建基于 Llama 的 NIM 和管道?,F(xiàn)在,我們正在幫助世界各地的企業(yè)實現(xiàn)這一目標,這確實是一件令人興奮的事情。

這一切都是由 Llama 開源引發(fā)的。

小扎:

我認為,幫助人們從大模型中提取自己的模型的能力將成為真正有價值的新事物。就像我們在產(chǎn)品方面討論的那樣,我不認為會有一個主要的人工智能代理與每個人交談。它們處于同一水平,我認為不一定存在一個所有人都使用的模型。

老黃:

我們有芯片設(shè)計AI、軟件編碼AI。我們的軟件編碼AI能夠理解USD,因為我們使用USD來編碼全宇宙的東西。我們有一個可以理解Verilog的AI,即我們的Verilog。我們擁有能夠了解錯誤數(shù)據(jù)庫并知道如何幫助我們分類錯誤并將其發(fā)送給合適工程師的軟件AI。每一個AI都是根據(jù)Llama進行微調(diào)的,因此我們對它們進行微調(diào)和保護。如果我們有一個用于芯片設(shè)計的AI,我們就不會對詢問政治、宗教等問題感興趣,因此我們對其進行了防護。

我認為每家公司基本上都會為其每一項功能配備專門構(gòu)建的AI,他們需要幫助才能做到這一點。

小扎:

未來的一個大問題是人們在多大程度上會使用更大、更復雜的模型,而不是僅僅為了他們的用途而訓練自己的模型。我敢打賭,它們將會是大量不同模型的混合體。

老黃:

我們使用最大的模型,因為我們的工程師的時間非常寶貴。我們現(xiàn)在獲得了針對性能進行了優(yōu)化的405B。正如您所知,405B不適合任何GPU,無論多大。這就是為什么NVLink性能如此重要。我們的每個GPU都通過一個稱為NVLink交換機的非阻塞交換機連接。例如,在HVAC中有兩個這樣的交換機。我們讓所有這些GPU都能工作并運行405B,真正發(fā)揮作用。我們這樣做的原因是因為工程師的時間對我們來說非常寶貴。我們想使用最好的模型。事實上,它只節(jié)省了幾分錢,誰在乎呢?因此我們只是想確保向他們呈現(xiàn)最優(yōu)質(zhì)的結(jié)果。

小扎:

我認為405的推理成本大約是GPT-4o模型的一半。在那個水平上,它已經(jīng)相當好了。但是,我認為人們正在設(shè)備上做一些事情,或者想要更小的模型。他們只是需要進一步提煉。

老黃:

這就像是一整套不同的服務。

假設(shè)我們正在雇用人工智能,用于芯片設(shè)計的人工智能每小時的費用大概是10美元。如果你在不斷使用它,并且與一群工程師共享該AI,那么每個工程師可能都有一個伴隨他們的AI,而且成本并不高。我們給工程師付了很多錢,所以,每小時幾美元可以放大某人的真正有價值的能力。

如果您還沒有雇用人工智能,請立即雇用。這就是我們要說的全部內(nèi)容。那么,讓我們來討論下一波。

我非常喜歡你們所做的工作之一,計算機視覺。我們內(nèi)部經(jīng)常使用的模型之一就是對所有事物進行細分。我們現(xiàn)在正在視頻上訓練人工智能模型,以便能夠理解世界模型。我們的用例是用于機器人和工業(yè)數(shù)字化,并將這些AI模型連接到Omniverse,以便更好地建模和表示物理世界,讓機器人更好地在這些Omniverse世界中運行。

您的應用程序Ray-Ban Metaglass,以及將AI引入虛擬世界的愿景確實很有趣。請告訴我們更多。

小扎:

是的,里面有很多內(nèi)容需要解開。您所談論的任意分段模型(Segment Anything2),我們實際上正在SIGGRAPH上展示它的下一個版本,任意分段二?,F(xiàn)在它可以工作得更快,并且可以在視頻中發(fā)揮作用。我認為這些實際上是來自我考艾島牧場的牛,順便說一下,這些被稱為三月美味牛。

老黃:

下次我們再一起做,馬克會來我家,我們一起做費城奶酪牛排。下次你要帶著牛來。然后到了晚上結(jié)束時,你會想,嘿,你吃夠了,我當時想,我不知道,我還能再吃一個。通常當你說類似的話時,是為了保持禮貌。我當時就想,是的,我們會生產(chǎn)更多的奶酪。你吃飽了嗎?通常你的客人會說,哦是的,我很好。再給我做一份奶酪牛排,詹森。

只是為了讓你知道他有多么強迫癥,所以我轉(zhuǎn)過身,準備奶酪牛排。我說:“馬克,切西紅柿?!庇谑邱R克,我遞給他一把刀。他把西紅柿切好,每一個都精確到毫米。真正有趣的是,我原本以為所有的西紅柿都會被切成片并堆放起來,有點像一副紙牌。但當我轉(zhuǎn)身時,他說他需要另一個盤子。原因在于他切開的所有西紅柿都沒有互相接觸。一旦他將一片西紅柿與另一片西紅柿分開,它們就不能再接觸。

他說,如果你想讓它們接觸,你就得告訴我。

這就是為什么我只是一名副廚師。這就是為什么他需要一個不會評判的人工智能。是的,這太酷了。它可以識別牛的蹤跡,正在識別并追蹤奶牛。

小扎:

用它可以實現(xiàn)很多有趣的效果,并且它還將為整個行業(yè)帶來許多更為嚴肅的應用??茖W家利用這些技術(shù)來研究珊瑚礁、自然棲息地以及景觀的演變等。

能夠在視頻中做到這一點,并將其作為零鏡頭,并能夠與它進行交互并告訴它你想要跟蹤什么,這是非??岬难芯?。

老黃:

舉個例子,我們使用它的原因是,你有一個倉庫,里面有一大堆攝像頭,倉庫人工智能正在監(jiān)視正在發(fā)生的一切。假設(shè)一堆箱子掉了,或者有人把水灑在了地上,或者無論發(fā)生什么事故,人工智能都會識別出來,生成文本,發(fā)送給某人,然后就會有人提供幫助。這是一種使用方法。

如果發(fā)生事故,它不會記錄所有內(nèi)容,也不會記錄視頻的每一納秒,然后回過頭來檢索那個時刻,它只會記錄重要的東西,因為它知道自己在看什么。因此,擁有一個視頻理解模型、一個視頻語言模型對于所有這些有趣的應用來說都非常強大。

現(xiàn)在,你們還準備做什么呢?雷朋眼鏡,跟我談談。

小扎:

是的,有很多智能眼鏡,所以我認為,當我們考慮下一個計算平臺時,我們會將其分解為混合現(xiàn)實、頭顯和智能眼鏡。而智能眼鏡,我認為人們更容易接受并佩戴它,因為幾乎每個今天戴眼鏡的人最終都會升級為智能眼鏡。這相當于世界上有十多億人。這將是一件大事。

VRM是頭顯。我認為有些人會發(fā)現(xiàn)它對于游戲或其他用途很有趣,有些還沒有。我的觀點是,它們將會同時存在于這個世界上。我認為智能眼鏡將會成為一種手機,一種下一代計算平臺的永遠在線版本?;旌犀F(xiàn)實頭顯將更像你的工作站或游戲機,當你坐下來進行更身臨其境的體驗時,你會希望獲得更多的計算能力。眼鏡的外形非常小,這方面將會面臨很多限制,就像你不能在手機上進行相同級別的計算一樣。

老黃:

它恰好出現(xiàn)在生成式人工智能領(lǐng)域取得所有這些突破的時候。

小扎:

是的,所以基本上,對于智能眼鏡,我們從兩個不同的方向來解決這個問題。一方面,我們一直在開發(fā)我們認為理想的全息AR眼鏡所需的技術(shù)。我們正在進行所有定制硅片的工作、所有定制顯示堆棧的工作,以及使這些工作得以完成所需要做的所有事情。它們是眼鏡,但這不是頭顯。它不像 VR 或 MR 頭顯。它們看起來像眼鏡,但與您現(xiàn)在佩戴的眼鏡相比還有很大差距。它們非常薄,但即使是我們生產(chǎn)的雷朋眼鏡,也無法將全息 AR 所需的所有技術(shù)都融入其中。我們越來越接近了。在接下來的幾年里,我認為我們將會更加接近彼此。雖然它仍然會相當昂貴,但我認為它會開始成為一種產(chǎn)品。

我們從另一個角度來討論這個問題,先從好看的眼鏡開始。通過與世界上最好的眼鏡制造商 Essler Luxottica 合作,他們基本上擁有您使用的所有大品牌。無論是雷朋 (Ray-Ban)、奧克利 (Oakley) 還是奧利弗·皮帕斯 (Oliver Peoples),或者只是少數(shù)其他品牌,這有點像 Essler Luxottica 是眼鏡界的 NVIDIA。

老黃:我認為他們可能會喜歡這個比喻。

小扎:

誰不愿意呢?

我們一直在與他們合作研發(fā)雷朋 (Ray-Bans) 眼鏡。我們已進入第二代。我們的目標是將外形尺寸限制為看起來很棒的尺寸。在此范圍內(nèi),我們盡可能多地投入技術(shù),同時明白我們無法從技術(shù)上達到理想效果,但最終,它會像很漂亮的眼鏡一樣。目前,我們已經(jīng)有了攝像傳感器,所以你可以拍攝照片和視頻。您實際上可以將直播流傳輸?shù)?Instagram。您可以在 WhatsApp 上進行視頻通話,并向?qū)Ψ街辈ツ吹降膬?nèi)容。它有麥克風和揚聲器,這個揚聲器確實非常好,是開放的耳朵設(shè)計,因此很多人覺得它比耳塞更舒適。您可以聽音樂,就像一種私人體驗一樣,這真是太棒了。人們喜歡這個,您可以用它接聽電話。

后來事實證明,這個傳感器包正是與人工智能對話所需要的東西,這算是一次意外。如果五年前你問我,我們是否會在人工智能之前獲得全息增強現(xiàn)實 (AR)?我會說,是的,可能吧。它看起來就像是所有虛擬和混合現(xiàn)實方面的圖形進展和顯示進展,并建立了新的顯示堆棧。我們正朝著這個目標不斷前進,這是正確的。隨后,這一突破在LLM學位課程上得以實現(xiàn)。事實證明,我們現(xiàn)在擁有非常高質(zhì)量的人工智能,并且在全息增強現(xiàn)實出現(xiàn)之前,它的改進速度非??臁_@是我真沒有想到的這種逆轉(zhuǎn)。

我們很幸運,因為我們致力于研發(fā)所有這些不同的產(chǎn)品。但我認為,最終你會得到一系列不同潛在眼鏡,不同價位的產(chǎn)品,以及不同技術(shù)水平的產(chǎn)品。因此,我認為,根據(jù)我們現(xiàn)在看到的雷朋 Metas 的情況,我猜售價 300 美元左右的無顯示屏 AI 眼鏡將成為一個真正受歡迎的產(chǎn)品,最終將有數(shù)千萬人或數(shù)億人擁有它。你將會擁有一個可以與你對話的超級互動人工智能。

老黃:

你剛剛展示了視覺語言理解,并且具備實時翻譯功能。你用一種語言和我說話,我聽到的卻是另一種語言。

小扎:

顯示屏顯然也會很棒,但它會增加眼鏡的重量,并且會使眼鏡變得更加昂貴。所以我認為會有很多人想要那種全息顯示屏,但也會有很多人希望最終能有像非常薄的眼鏡一樣的設(shè)備。

老黃:

對于工業(yè)應用和一些工作應用,我們需要它。我也認為對于消費品而言也是如此。你這么認為嗎?

小扎:

是的,我想,在 COVID 期間,當每個人都遠程辦公一段時間時,我就經(jīng)??紤]這個問題。就好像你把所有的時間都花在了 Zoom 上。擁有這樣的技術(shù)真是太好了,但是在未來,我們大概要不了幾年就能舉行虛擬會議,就好像我并不是親自到場,這只是我的全息圖而已。感覺我們就在那里,親臨現(xiàn)場。我們可以一起做某事,一起合作做某事。

但我認為這對于人工智能來說尤其重要。對于該應用程序,我可以忍受不經(jīng)常佩戴的設(shè)備。噢,是的,但我認為我們將會達到事實上的程度。是的,我可以。眼鏡有各種各樣的款式,有細鏡框的,也有粗鏡框的。但我認為我們距離擁有與你的眼鏡形狀相同的全息眼鏡還有一段時間。不過,我認為將它安裝在一副時尚的厚框眼鏡上也并不遙遠。如今,這些太陽鏡都適合小臉型。我看得出來。

老黃:

是的,這是一種非常有用的風格。無論是誰,就像我在努力成為一名時尚影響者,這樣我就能在這副眼鏡進入市場之前對其產(chǎn)生影響。

小扎:但我不知道。

老黃:

好吧,我看到你正在嘗試。你的風格對你的鍛煉有什么影響?

小扎:

現(xiàn)在還早,還早。

但我覺得如果未來業(yè)務的很大一部分是制造人們佩戴的時尚眼鏡,那么我應該開始更多地關(guān)注這一點。好的。是的,我們將不得不淘汰每天穿同樣衣服的我。但眼鏡也有同樣的問題。我認為它與手表或手機不同,人們真的不希望它們看起來都一樣。正確的。

所以我確實認為,這是一個適合的平臺,回到我們之前談到的主題,走向一個開放的生態(tài)系統(tǒng),因為我認為人們對形式因素和風格要求的多樣性將是巨大的。并不是每個人都不想戴這種眼鏡,無論其他人設(shè)計什么,那都是不行的,我認為那樣不會成功。是的,我認為是對的。

老黃:

馬克,我們正處于一個整個計算堆棧被重新發(fā)明的時代,這真是令人難以置信。我們?nèi)绾慰创浖?,安德烈稱之為軟件一和軟件二,現(xiàn)在我們基本上處于軟件三。我們從通用計算方式到這些生成神經(jīng)網(wǎng)絡處理的計算方式,我們現(xiàn)在可以開發(fā)的功能和應用程序在過去是不可想象的。生成式人工智能是一項能夠迅速影響消費者、企業(yè)、行業(yè)和科學的技術(shù)。我不記得還有哪項技術(shù)能如此快速地在各個領(lǐng)域產(chǎn)生如此深遠的影響。它不僅跨越了氣候技術(shù)、生物技術(shù)、物理科學等所有不同的科學領(lǐng)域,而且在我們所遇到的每一個領(lǐng)域中,生成式人工智能都處于根本性轉(zhuǎn)變的中心。

除此之外,正如您所談論的,生成式人工智能將對社會產(chǎn)生深遠的影響。我們正在生產(chǎn)的產(chǎn)品中,有一件讓我非常興奮的事情。之前有人問我,是否會有 Jensen AI?這正是您所說的創(chuàng)造性人工智能,我們可以構(gòu)建自己的人工智能。我把我寫的所有內(nèi)容都放到里面,并根據(jù)我回答問題的方式對其進行微調(diào)。希望隨著時間的推移和使用次數(shù)的積累,它會成為許多想要提問或交流想法的人的真正助手和伙伴。

正如您之前所說,這將是 Jensen 的版本,不會帶有任何評判性。你不怕受到評判,這樣你就可以隨時與它互動。我認為這些真是令人難以置信的事情。而且您知道,我們一直在寫很多東西。僅僅給出三到四個主題,這真是不可思議的事情。這些是我想要寫的基本主題,我用我的聲音來寫,只是以此作為起點。所以現(xiàn)在我們可以做的事情太多了。

和你一起工作真是太棒了。我知道創(chuàng)立一家公司并不容易。你們將業(yè)務從桌面轉(zhuǎn)向移動、VR、AI等所有這些設(shè)備。這真的、真的、真的很非凡。NVIDIA 自身也經(jīng)歷了多次轉(zhuǎn)型。我非常清楚做到這一點有多么困難。而且這么多年來,我們倆都遭受過很多次打擊。但這正是成為先驅(qū)和創(chuàng)新的必需條件。看到你真是太好了。

(全場掌聲)

小扎:

同樣,如果你繼續(xù)做以前做的事情,不確定它是否是一個支點,但你也可以在其基礎(chǔ)上添加內(nèi)容。這一切還有更多章節(jié)。我認為同樣的事情是,觀看你們所經(jīng)歷的旅程很有趣。我們經(jīng)歷了這樣一個時期,每個人都說,一切都將轉(zhuǎn)移到這些設(shè)備上,它將獲得超級便宜的計算。你們一直為此努力著。

老黃:

實際上,你會想要這些能夠癱瘓的大型系統(tǒng)。我們走了另一條路。我們不再制造越來越小的設(shè)備,而是制造倉庫大小的計算機。一時不時髦,有點不時髦,超級不時髦。但現(xiàn)在很酷。相反,我們開始構(gòu)建圖形芯片,即 GPU?,F(xiàn)在,當您部署 GPU 時,您仍將其稱為 Hopper H100。當扎克伯格稱其為 H100 時,他的 H100 數(shù)據(jù)中心數(shù)量會達到 600,000。而且他們是好顧客。

小扎:這就是您在 SIGGRAPH 上獲得 Jensen 問答的方式。

老黃:

哇。請稍等,我正在查看馬克·扎克伯格的問答。你是我的客人,我想確保馬克……

小扎:

有一天你打電話給我,說再過幾周我們將在 SIGGRAPH 上做這件事。那天我什么都沒做,我離開了丹佛,這聽起來很有趣。確切地說,那天下午我什么事也沒有做,你剛剛出現(xiàn)。

老黃:

這件事實在令人難以置信。你們構(gòu)建的這些系統(tǒng)都是巨型系統(tǒng),極難協(xié)調(diào)和運行。你說過你進入 GPU 領(lǐng)域比大多數(shù)人都晚,但你的運營規(guī)模卻比任何人都大,真是令人難以置信。祝賀你所做的一切?,F(xiàn)在你已經(jīng)成為時尚偶像了??纯催@個家伙。

女士們、先生們,馬克·扎克伯格~ 謝謝。

分享到

nina

相關(guān)推薦