AReaL-boba的推出標(biāo)志著強(qiáng)化學(xué)習(xí)訓(xùn)練框架在效率、性能和可擴(kuò)展性上的突破,也為開發(fā)者提供了高效、低成本的解決方案,加速了推理模型的發(fā)展。
據(jù)了解,螞蟻和清華組成的AReal研發(fā)團(tuán)隊計劃持續(xù)開源訓(xùn)練代碼、數(shù)據(jù)集及流程,并將優(yōu)化異步訓(xùn)練、吞吐性能,升級數(shù)據(jù)集和算法,進(jìn)一步提升框架能力。