然而,這款A(yù)I生成的“游戲”卻引發(fā)了廣泛的批評(píng)和爭(zhēng)議。

Oasis的畫(huà)面質(zhì)量令人失望,其分辨率僅為360p,幀率更是低至20FPS,甚至不及任天堂64時(shí)代的游戲。更為嚴(yán)重的是,該AI模型存在顯著的幻覺(jué)問(wèn)題,導(dǎo)致游戲體驗(yàn)極不穩(wěn)定。玩家無(wú)法進(jìn)行復(fù)雜操作,甚至在簡(jiǎn)單的挖掘動(dòng)作中,常常會(huì)被意外傳送回地面。此外,游戲環(huán)境中的物體缺乏持久性,玩家的建造成果無(wú)法保存。

Oasis是如何煉成的

之前谷歌推出的GameNGen本質(zhì)上仍是一個(gè)由AI驅(qū)動(dòng)的游戲引擎,但Oasis的底層機(jī)制并不是游戲引擎,而是單一的視頻生成模型,相當(dāng)于一個(gè)能交互、可玩的Sora。

那么,Oasis究竟是如何做到的?

根據(jù)博客介紹,技術(shù)團(tuán)隊(duì)進(jìn)行了數(shù)百次架構(gòu)和數(shù)據(jù)實(shí)驗(yàn),以確定用于快速生成自回歸交互式視頻的最佳架構(gòu)。

Oasis模型均基于Transformer架構(gòu),由基ViT的變分自動(dòng)編碼器(VAE)和基于DiT的潛在擴(kuò)散主干組成,使用了加速過(guò)的軸向、時(shí)空和因果注意力機(jī)制來(lái)克服長(zhǎng)序列中的模型發(fā)散(divergence)。

Oasis的ViT+DiT架構(gòu)

VAE就像是工廠(chǎng)里負(fù)責(zé)整理和識(shí)別原材料(游戲里的各種信息)的車(chē)間,它基于ViT(Vision Transformer)架構(gòu),能夠?qū)吹降挠螒虍?huà)面的相關(guān)信息進(jìn)行加工整理。

主干即工廠(chǎng)的核心生產(chǎn)線(xiàn),基于DiT(Diffusion Transformer)架構(gòu),負(fù)責(zé)將加工處理好的信息產(chǎn)出游戲內(nèi)容,比如游戲場(chǎng)景、物體等。

同時(shí),利用Decart的推理引擎,結(jié)合Etched公司的Sohu(Transformer架構(gòu)的ASIC)芯片,實(shí)現(xiàn)了實(shí)時(shí)視頻生成。

這種架構(gòu)選擇保證了在Sohu芯片上的穩(wěn)定擴(kuò)展和快速推理,并且以自回歸方式生成幀,能夠根據(jù)游戲輸入實(shí)時(shí)交互。

Sora這類(lèi)模型根據(jù)用戶(hù)輸入的文本內(nèi)容直出視頻,但Oasis使用Diffusion Forcing進(jìn)行訓(xùn)練,每次只生成一幀,根據(jù)游戲輸入在token級(jí)別調(diào)節(jié)每個(gè)幀,因此可操縱性很高。

之所以能夠被稱(chēng)為「世界模型」,是因?yàn)镺asis已經(jīng)能夠了解復(fù)雜的游戲機(jī)制,例如理解物體和建筑、照明的物理規(guī)律等等。

1

模型理解照明的物理原理

2

放置立方體磚塊

兩家初創(chuàng),強(qiáng)強(qiáng)聯(lián)手

生成式交互體驗(yàn)新紀(jì)元這就來(lái)了嗎?這兩家初創(chuàng)公司又是什么來(lái)頭?

據(jù)公開(kāi)報(bào)道,Oasis模型是由Decart和Etched兩家初創(chuàng)公司共同推出的。

Decart成立于2023年9月,一直致力于提高AI模型的效率和降低運(yùn)行成本,提供更快、更可靠的訓(xùn)練以及實(shí)時(shí)推理,成立三個(gè)月后便與一家GPU云服務(wù)商達(dá)成了數(shù)百萬(wàn)美元的交易。

紅杉資本更是豪擲2100萬(wàn)美金對(duì)其進(jìn)行了投資,合伙人Shaun Maguire更是大力稱(chēng)贊Decart的團(tuán)隊(duì),認(rèn)為他們是「超精英的AI工程師」、「合作過(guò)的技術(shù)最有天賦的團(tuán)隊(duì)之一」,正在將生成式體驗(yàn)推向極致。

游戲體驗(yàn)并不理想

但是Oasis的畫(huà)面質(zhì)量令人失望,其分辨率僅為360p,幀率更是低至20FPS,甚至不及任天堂64時(shí)代的游戲。不過(guò),如果在Etched打造的Sohu芯片上運(yùn)行 100B+參數(shù)的優(yōu)化模型,就能達(dá)到4K級(jí)別的實(shí)時(shí)渲染,并發(fā)用戶(hù)數(shù)量也將提升超過(guò)10x。

更為嚴(yán)重的是,該AI模型存在顯著的幻覺(jué)問(wèn)題,導(dǎo)致游戲體驗(yàn)極不穩(wěn)定。玩家無(wú)法進(jìn)行復(fù)雜操作,甚至在簡(jiǎn)單的挖掘動(dòng)作中,常常會(huì)被意外傳送回地面。此外,游戲環(huán)境中的物體缺乏持久性,玩家的建造成果無(wú)法保存。

盡管Oasis宣稱(chēng)將開(kāi)源代碼,但外界對(duì)其侵權(quán)行為表示質(zhì)疑。該項(xiàng)目使用了 OpenAI的Minecraft VPT數(shù)據(jù)集進(jìn)行訓(xùn)練,包含7萬(wàn)小時(shí)的在線(xiàn)視頻數(shù)據(jù),其中大部分來(lái)自《我的世界》。這一點(diǎn)引發(fā)了對(duì)模型原創(chuàng)性的關(guān)注。

雖然許多AI愛(ài)好者認(rèn)為,將AI技術(shù)應(yīng)用于經(jīng)典游戲如《反恐精英:全球攻勢(shì)》和《毀滅戰(zhàn)士》是游戲領(lǐng)域的進(jìn)步,但對(duì)于大多數(shù)玩家而言,真正的游戲引擎和硬件設(shè)備依然是最可靠、高效的游戲體驗(yàn)方式。AI生成的游戲雖然能模仿現(xiàn)有游戲的元素,但缺乏深度與原創(chuàng)性。

Oasis的推出再次凸顯了AI技術(shù)在游戲領(lǐng)域面臨的挑戰(zhàn)。盡管AI可以生成一些簡(jiǎn)單的游戲元素,但要?jiǎng)?chuàng)造出真正復(fù)雜、原創(chuàng)的游戲,仍然需要人類(lèi)的創(chuàng)意和技術(shù)。

結(jié)語(yǔ)

總的來(lái)說(shuō),Decart AI推出的Oasis模型具有實(shí)時(shí)生成與交互、架構(gòu)優(yōu)勢(shì)、創(chuàng)新訓(xùn)練方法等特點(diǎn),為游戲領(lǐng)域帶來(lái)了全新的體驗(yàn)。雖然目前畫(huà)面質(zhì)量和用戶(hù)體驗(yàn)還有待提升,但其市場(chǎng)前景廣闊,有望在未來(lái)的游戲開(kāi)發(fā)中發(fā)揮重要作用。讓我們拭目以待,看看視頻生成模型領(lǐng)域接下來(lái)還會(huì)帶給我們哪些驚喜與突破。(文/宋雨涵)

分享到

lixiangjing

算力豹主編

相關(guān)推薦