谷歌正利用大模型训练机器人，使其能够完成更多任务-品玩

谷歌正利用大模型训练机器人，使其能够完成更多任务

2024年7月15日

品玩7月15日讯，据 The Verge 报道，谷歌 DeepMind 研究团队近日正在尝试利用 Gemini 大模型训练机器人，让他们完成更复杂的任务。

据悉，该团队在最新发表的论文中指出，Gemini 1.5 Pro 的上下文窗口足以让用户可以更轻松地使用自然语言指令与 RT-2 机器人互动。其工作原理是拍摄指定区域的视频导览，让机器人通过 Gemini 1.5 Pro 学习当前空间的现实环境；然后，机器人可以根据观察到的情况，通过语言和图像输出来执行命令。

另外研究人员还发现，Gemini 1.5 Pro 能让机器人计划如何完成导航以外的指令。