品玩3月5日讯,据财联社报道,蚂蚁集团联合清华大学正式发布开源强化学习训练框架AReaL v1.0稳定版。该版本的核心目标是实现“智能体(Agent)一键接入强化学习训练”,旨在为开发者提供开箱即用的便捷体验。
该框架的突出特点在于无需修改现有代码即可兼容各类Agent框架。其技术路径是在智能体与训练系统之间加入Proxy Worker中转层,开发者仅需修改请求地址即可完成接入,从而真正实现了零改造接入RL训练。
AReaL是业界首个全异步训推解耦的大模型强化学习训练系统。这一架构使得智能体能够在与真实世界任务持续交互的过程中获取反馈,并不断优化其决策过程,为通用智能体的研究与高效应用提供了坚实支撑。





0 条评论
请「登录」后评论