品玩

科技创新者的每日必读

打开APP
关闭

蚂蚁集团与清华大学联合发布强化学习开源框架AReaL稳定版

3月5日

品玩3月5日讯,据财联社报道,蚂蚁集团联合清华大学正式发布开源强化学习训练框架AReaL v1.0稳定版。该版本的核心目标是实现“智能体(Agent)一键接入强化学习训练”,旨在为开发者提供开箱即用的便捷体验。

该框架的突出特点在于无需修改现有代码即可兼容各类Agent框架。其技术路径是在智能体与训练系统之间加入Proxy Worker中转层,开发者仅需修改请求地址即可完成接入,从而真正实现了零改造接入RL训练。

AReaL是业界首个全异步训推解耦的大模型强化学习训练系统。这一架构使得智能体能够在与真实世界任务持续交互的过程中获取反馈,并不断优化其决策过程,为通用智能体的研究与高效应用提供了坚实支撑。

取消 发布

下载品玩App,比99.9%的人更先知道关于「蚂蚁集团」的新故事

下载品玩App

比99.9%的人更先知道关于「蚂蚁集团」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测