字节跳动发布GR-RL框架，实现机器人穿鞋带新突破-品玩

字节跳动发布GR-RL框架，实现机器人穿鞋带新突破

2025年12月3日

品玩12月3日讯，据pandaily 报道，字节跳动Seed团队近日推出新型强化学习框架GR-RL，显著提升视觉语言动作（VLA）模型在长时间、精细操作任务中的能力。

该框架通过从离线数据筛选到在线实机微调的全流程优化，首次实现机器人连续完成整根鞋带穿引全过程，成功率达83.3%。

相较此前基于监督学习的GR-3模型，GR-RL将穿鞋带任务成功率从45.7%大幅提升近一倍，失败率降低近70%，标志着机器人灵巧操作能力取得重要进展。该成果为复杂精细操作的自动化提供了新路径。

下载品玩App，比99.9%的人更先知道关于「字节跳动」的新故事

下载品玩App

比99.9%的人更先知道关于「字节跳动」的新故事

AI阅读助手

以下有两点提示，请您注意：
1. 请避免输入违反公序良俗、不安全或敏感的内容，模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务，但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时，您需要自行判断并承担风险；
感谢您的理解与配合

该功能目前正处于内测阶段，尚未对所有用户开放。如果您想快人一步体验产品的新功能，欢迎点击下面的按钮申请参与内测申请内测