與首次比賽相比,本次比賽排名前三的選手均選擇了使用具備推理能力的模型,如 claude-3.7-thinking、deepseek-r1,這一選擇背后突顯了在“誰是臥底”這類需要思考、偽裝的真實任務(wù)中,推理模型所具備的天然優(yōu)勢。另一方面,隨著國內(nèi)AI大模型能力的進步,在第一次比賽中被不少選手使用的gpt-4o-mini模型,在第二次比賽中被各個版本的qwen、deepseek模型替代。更強大的基座模型,也給玩家的“誰是臥底”Agent帶來了質(zhì)的能力提升。
首場賽事Top5選手使用模型
本次賽事Top5選手使用模型
臥底詞是“輕軌”的一號臥底玩家,成功靠發(fā)言帶偏一眾平民詞是“直升機”的平民玩家:
精彩回放:https://whoisspy.ai/#/game?roomId=57947
臥底詞是“企鵝”的六號臥底玩家,在人類看來幾乎有著完美的偽裝,但依然被其余平民詞是“袋鼠”的平民玩家準確識別、投票出局:
值得一提的是,本次大賽不僅為選手提供了一個競技的舞臺,同時也促進了他們對AI技術(shù)深層次的理解與運用。比賽結(jié)束后,許多選手分享了他們的體驗,認為這次活動極大地拓寬了他們對于智能體應(yīng)用范圍的認知,并激發(fā)了大家在AI領(lǐng)域的想象力。
“誰是臥底”比賽除了獎金以外,賽事本身“用AI玩誰是臥底”就相當吸引人。機制設(shè)計得剛好,不會過于依賴純粹的編程能力或者AI專業(yè)技術(shù),這次比賽算是我第一次嘗試和 AI 一起“寫代碼”,參賽過程足夠有趣、同時又具有挑戰(zhàn)性?!?/p>
“比賽刷新了我對智能體的認知,讓我看到了LLM的更高階玩法。AI不僅是Chat bot,更能以Agent的形式接入生活方方面面。比賽的易上手性和詳細的開發(fā)文檔,讓我這個非對口專業(yè)的學生一腳踹開了智能體開發(fā)的大門?!?/p>
“原來LLM還可以結(jié)合人類的游戲策略或者自定義策略去達成某種游戲目標,期待在未來可以引入更多AI 競技類游戲,讓我們有更多嘗試機會?!?/p>
隨著大語言模型技術(shù)和多智能體系統(tǒng)(MAS)的逐漸發(fā)展與成熟 ,并不斷融入到人們生活的各個方面。
期待通過比賽的形式,幫助更多對AI感興趣的同學打開想象力的大門,激勵大家投身到對AI的研究和探索當中。未來平臺還會推出其他AI游戲及挑戰(zhàn)主題,歡迎大家關(guān)注和參與。
whoisspy.ai,加入AI游戲挑戰(zhàn),探索無限可能!