AI NPC可做出高擬真表情
最后,利用相位神經(jīng)網(wǎng)絡(luò)技術(shù)控制人物運(yùn)動(dòng),將原本數(shù)周工作量減少到幾小時(shí)。AI 在大量的運(yùn)動(dòng)數(shù)據(jù)集上學(xué)習(xí)人體動(dòng)作,將捕獲的運(yùn)動(dòng)數(shù)據(jù)與場(chǎng)景地形數(shù)據(jù)相匹配,完成準(zhǔn)確、流暢的動(dòng)作反應(yīng),如行走、跑步、跳躍等。
AI輔助生成游戲角色動(dòng)作
在游戲中,AI既是運(yùn)營(yíng)者也是陪伴玩家的智能伙伴。AI能扮演玩家的對(duì)手或隊(duì)友,提供創(chuàng)新玩法,不斷豐富游戲活力。而作為管理者,AI能為玩家智能匹配合適的隊(duì)友,接管掉線玩家,還能利用自然語(yǔ)言處理等技術(shù),在監(jiān)測(cè)到不當(dāng)發(fā)言時(shí)予以屏蔽,維護(hù)良好的對(duì)局環(huán)境。
在游戲周邊,AI也在支持電競(jìng)訓(xùn)練分析、直播解說(shuō)及集錦自動(dòng)生成等更廣泛的應(yīng)用,不斷創(chuàng)新行業(yè)生態(tài)。總之,AI正在為游戲全生命周期中的更多環(huán)節(jié),創(chuàng)造全新價(jià)值。
AI應(yīng)用深入游戲全生命周期
“絕悟”AI為不同類型游戲帶來(lái)全新價(jià)值
騰訊AI Lab自2017年開(kāi)始研發(fā)策略協(xié)作型AI“絕悟”,在本次GDC大會(huì)上,實(shí)驗(yàn)室介紹了AI“絕悟”在兩類熱門(mén)游戲的實(shí)戰(zhàn)應(yīng)用成果,包括MOBA游戲“王者榮耀”,及FPS游戲“使命召喚”與“穿越火線”手機(jī)版。
MOBA游戲:完全體AI與平衡性測(cè)試應(yīng)用
基于王者榮耀的“王者絕悟”AI 經(jīng)過(guò)多次迭代,已成為達(dá)到職業(yè)電競(jìng)水平的“完全體”,掌握100+全英雄池,全召喚師技能,無(wú)任何限制、數(shù)值加成、無(wú)額外視野,操作反應(yīng)也與職業(yè)選手相當(dāng),保證公平對(duì)抗?!巴跽呓^悟”不僅具備強(qiáng)大的策略協(xié)作與微觀操作能力,還擅長(zhǎng)多樣化打法與全局禁選英雄策略。相關(guān)強(qiáng)化學(xué)習(xí)研究成果也已登上AI國(guó)際頂會(huì)與頂刊。
2020年,“王者絕悟”在王者榮耀游戲內(nèi)向用戶限時(shí)開(kāi)放,接受玩家5v5組隊(duì)挑戰(zhàn),單次運(yùn)營(yíng)活動(dòng)就吸引了超過(guò)4千萬(wàn)玩家參與體驗(yàn)并廣受好評(píng)。不少用戶與主播還將對(duì)局制作成生動(dòng)有趣的視頻,在社交媒體和視頻平臺(tái)發(fā)布傳播,形成AI-用戶-社區(qū)的正向反饋。
此次大會(huì)上,“絕悟”還首次公開(kāi)了AI輔助英雄平衡性測(cè)試的技術(shù)成果。MOBA游戲核心玩法在于多樣化的英雄選擇和戰(zhàn)斗體驗(yàn),從而增加不確定性與趣味性。一旦某些英雄過(guò)強(qiáng)或過(guò)弱,就會(huì)破壞玩家體驗(yàn),因此保持每個(gè)英雄勝率50%左右是王者榮耀平衡性系統(tǒng)的目標(biāo)。
然而平衡性測(cè)試系統(tǒng)非常復(fù)雜,不僅涉及大量英雄,且每個(gè)英雄都有獨(dú)特的技能、屬性、玩法,英雄之間還存在互動(dòng),任何微小的變化都會(huì)產(chǎn)生意想不到的連鎖反應(yīng)影響,評(píng)估系統(tǒng)變化相當(dāng)困難。
傳統(tǒng)的平衡性測(cè)試是調(diào)整數(shù)值后在測(cè)試服上驗(yàn)證,周期較長(zhǎng),每個(gè)英雄測(cè)試大約需要1-2個(gè)月。此外,由于正式服和測(cè)試服玩家的真實(shí)能力和游戲心態(tài)不一致,會(huì)導(dǎo)致測(cè)試結(jié)果不準(zhǔn)確。
在解決準(zhǔn)確性問(wèn)題上,絕悟AI通過(guò)強(qiáng)化學(xué)習(xí)的方法來(lái)模仿真實(shí)玩家,包括發(fā)育、運(yùn)營(yíng)、協(xié)作等指標(biāo)類別,以及每分鐘手速、技能釋放頻率、命中率、擊殺數(shù)等具體參數(shù),讓AI更接近正式服玩家真實(shí)表現(xiàn),將測(cè)試的總體準(zhǔn)確性提升到95%。
在提高測(cè)試效率方面,絕悟AI通過(guò)分布式平臺(tái)和推理優(yōu)化節(jié)省了大量的時(shí)間。分布式平臺(tái)支持大規(guī)模并發(fā)測(cè)試,開(kāi)發(fā)者只需要輸入英雄的修改數(shù)值,平臺(tái)就會(huì)在短時(shí)間內(nèi)自動(dòng)輸出測(cè)試報(bào)告。推理優(yōu)化則通過(guò)模型剪裁、量化、自研推理框架來(lái)減少模型的計(jì)算量和加快推理速度,實(shí)現(xiàn)3小時(shí)完成20萬(wàn)場(chǎng)對(duì)局。
FPS游戲:全游戲能力與擬人化技術(shù)
對(duì)于FPS類型游戲來(lái)說(shuō),NPC的擬人化是AI研究的核心目標(biāo)。在游戲內(nèi),勢(shì)均力敵的戰(zhàn)斗勝利才會(huì)帶來(lái)公平感和成就感。因此 AI 既不能強(qiáng)如開(kāi)掛,也不能呆若木雞,更擬人化的 AI 才能提升玩家體驗(yàn)。
在游戲領(lǐng)域之外,FPS 游戲擬人化 AI 也具有非常重要的研究?jī)r(jià)值。不同于總是通過(guò)俯視角進(jìn)行的棋盤(pán)游戲和 MOBA 游戲等游戲類別,FPS 等第一人稱游戲往往基于三維立體的游戲場(chǎng)景,更類似于真實(shí)世界。在這樣的虛擬環(huán)境中訓(xùn)練出的擬人化AI,更能反映人類在真實(shí)環(huán)境下的表現(xiàn),從而可以幫助AI理解人類在真實(shí)環(huán)境中的行為,為以后的通用能力應(yīng)用鋪路。
在本次大會(huì)上,騰訊AI Lab也分享了AI在FPS類游戲中的擬人化能力與技術(shù)方法。
第一步是讓AI掌握全游戲能力,即能夠完成游戲中的任何任務(wù)。以“吃雞”模式為例,玩家的目標(biāo)是“活到最后”,關(guān)鍵任務(wù)包括,區(qū)域探索、收集武器和裝備,進(jìn)入安全區(qū)并與敵人戰(zhàn)斗等。
傳統(tǒng)方法的游戲開(kāi)發(fā)通常使用行為樹(shù)模型設(shè)計(jì)AI,然而,這種“窮舉法”只能產(chǎn)生有限和固定行為模式。而采用強(qiáng)化學(xué)習(xí)方法,則可以通過(guò)從0到1,完成端到端訓(xùn)練,通過(guò)觀察設(shè)計(jì)、模型設(shè)計(jì)、行動(dòng)空間設(shè)計(jì)和獎(jiǎng)勵(lì)機(jī)制,實(shí)現(xiàn)高智能AI。
三個(gè)AI合作擊敗對(duì)手
掌握全游戲能力后,第二步就要提升AI的擬人化表現(xiàn)。試想我們自己作為玩家處于游戲中戰(zhàn)斗場(chǎng)景,會(huì)選擇站在什么位置?用哪把槍?命中率如何?回答這些問(wèn)題對(duì)普通玩家已不容易,對(duì)AI來(lái)說(shuō)也同樣困難。
騰訊AI Lab采用對(duì)抗學(xué)習(xí)的技術(shù)探索解決 AI 擬人化難題。首先需要輸入兩組數(shù)據(jù),一是高質(zhì)量的人類脫敏數(shù)據(jù),二是前述通過(guò)強(qiáng)化學(xué)習(xí)方法訓(xùn)練而成的 AI NPC 數(shù)據(jù)。然后,兩者數(shù)據(jù)再經(jīng)過(guò)鑒別器區(qū)隔,并輸出一套內(nèi)在獎(jiǎng)勵(lì)機(jī)制,激勵(lì)A(yù)I不斷向人類行為靠攏。
基于擬人化AI研究,騰訊AI Lab與《穿越火線》手機(jī)版合作打造了“明星玩法”——挑戰(zhàn)職業(yè)選手。AI通過(guò)模仿職業(yè)選手,掌握他們的典型個(gè)人風(fēng)格,玩家則感覺(jué)像在與真實(shí)的職業(yè)選手對(duì)抗。該玩法上線后大受歡迎,對(duì)局?jǐn)?shù)量較平時(shí)平均數(shù)提升了3-4倍。
AI模仿職業(yè)選手打法風(fēng)格,左上為職業(yè)選手,右下為AI
超越游戲,AI驅(qū)動(dòng)虛實(shí)結(jié)合的無(wú)限可能
從虛擬世界到現(xiàn)實(shí)世界,游戲?yàn)锳I提供了低成本的學(xué)習(xí)環(huán)境,訓(xùn)練AI逐步進(jìn)化為通用人工智能,從而在現(xiàn)實(shí)世界中發(fā)揮越來(lái)越重要的作用。
比如在虛擬環(huán)境中模擬現(xiàn)實(shí)任務(wù),讓自動(dòng)駕駛汽車在不同條件下模擬行駛,效率高、成本低,也更安全。再如,騰訊利用仿真環(huán)境與強(qiáng)化學(xué)習(xí)算法,推進(jìn)機(jī)器人及數(shù)據(jù)中心節(jié)能技術(shù)等研究與應(yīng)用。
同時(shí),從現(xiàn)實(shí)世界到虛擬世界,AI正在成為“元宇宙”基礎(chǔ)設(shè)施,逐步構(gòu)建更高品質(zhì)、更開(kāi)放、更沉浸和更多樣的虛擬世界,突破內(nèi)容和空間的局限性,創(chuàng)造前所未有的體驗(yàn)與機(jī)遇。