品玩7月15日讯,据 The Verge 报道,谷歌 DeepMind 研究团队近日正在尝试利用 Gemini 大模型训练机器人,让他们完成更复杂的任务。
据悉,该团队在最新发表的论文中指出,Gemini 1.5 Pro 的上下文窗口足以让用户可以更轻松地使用自然语言指令与 RT-2 机器人互动。其工作原理是拍摄指定区域的视频导览,让机器人通过 Gemini 1.5 Pro 学习当前空间的现实环境;然后,机器人可以根据观察到的情况,通过语言和图像输出来执行命令。
另外研究人员还发现,Gemini 1.5 Pro 能让机器人计划如何完成导航以外的指令。

0 条评论
请「登录」后评论