品玩12月3日讯,据pandaily 报道,字节跳动Seed团队近日推出新型强化学习框架GR-RL,显著提升视觉语言动作(VLA)模型在长时间、精细操作任务中的能力。
该框架通过从离线数据筛选到在线实机微调的全流程优化,首次实现机器人连续完成整根鞋带穿引全过程,成功率达83.3%。
相较此前基于监督学习的GR-3模型,GR-RL将穿鞋带任务成功率从45.7%大幅提升近一倍,失败率降低近70%,标志着机器人灵巧操作能力取得重要进展。该成果为复杂精细操作的自动化提供了新路径。

字节跳动发布GR-RL框架,实现机器人穿鞋带新突破
24小时前品玩12月3日讯,据pandaily 报道,字节跳动Seed团队近日推出新型强化学习框架GR-RL,显著提升视觉语言动作(VLA)模型在长时间、精细操作任务中的能力。
该框架通过从离线数据筛选到在线实机微调的全流程优化,首次实现机器人连续完成整根鞋带穿引全过程,成功率达83.3%。
相较此前基于监督学习的GR-3模型,GR-RL将穿鞋带任务成功率从45.7%大幅提升近一倍,失败率降低近70%,标志着机器人灵巧操作能力取得重要进展。该成果为复杂精细操作的自动化提供了新路径。

下载品玩App,比99.9%的人更先知道关于「字节跳动」的新故事
下载品玩App
比99.9%的人更先知道关于「字节跳动」的新故事




0 条评论
请「登录」后评论