為了實現(xiàn)MuZero AI的目標(biāo),早在今年4月DeepMind就創(chuàng)建了一個名為Agent57的實驗性AI,它的任務(wù)是游玩40年前57個雅達(dá)利游戲。 DeepMind團(tuán)隊解釋說之所以選擇雅達(dá)利游戲是因為“這些游戲為AI提供了豐富的任務(wù),AI必須制定復(fù)雜的行為策略來掌握這些任務(wù),同時游戲本身還提供了一種輕松的進(jìn)度指標(biāo)(也就是游戲內(nèi)的得分)這可以讓AI自行判斷并優(yōu)化自己的策略,優(yōu)中選優(yōu)最后完美完成任務(wù)。”眼下MuZero的出現(xiàn)意味著人工智能不再需要機(jī)械的學(xué)習(xí)人類的單一規(guī)則,只需要一套通用算法,MuZero就可以自行掌握諸如圍棋、日本將棋、國際象棋以及雅達(dá)利游戲,未來人工智能還能發(fā)展成什么樣子,我們只能繼續(xù)期待。

分享到

崔歡歡

相關(guān)推薦