品玩

科技创新者的每日必读

打开APP
关闭
Google

DeepMind AI 想要在《星际争霸》打赢人类,还是太天真了

从 80 年代的游戏里学习一个

杜莉莉

发布于 2016年6月10日

在 AlphaGo 战胜了韩国围棋棋手李世石后,DeepMind 创始人戴密斯·哈萨比斯(Demis Hassabis)就曾表示将研究以人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸》。不过目前看来,DeepMind AI 要跟人类比赛打《星际争霸》这事,还是有点儿悬。

早在 2015 年,DeepMind AI 就开始用已经雅达利 1977 年发行的游戏机 Atari 2600 来进行游戏训练,整个训练过程团队没有提供任何额外信息帮助,全依靠 AI 自己来一步步学习如何打怪升级。在这些游戏里,有一款游戏始终让 DeepMind AI 很苦恼,那就是《Montezuma’s revenge》,这是雅达利一款难度超高的游戏。

后来团队找到了“好奇心”激励机制,来让 DeepMind AI 获胜。他们给 AI 变成编程输入“人工好奇心”,在 AI 探索更多的玩法的时候给予它更多的奖励,鼓励它去用不同的途径来获取更高的分数。在新版本里,DeepMind AI 在好奇心的驱动下探索了 15 个房间的游戏。在没有好奇心的时候,它只玩了 2 个房间。

今年 3 月底,在 AlphaGo 五局四胜赢了李世石之后,暴雪娱乐制作总监 Tim Morten 就在 WCS 中国区总决赛上确认,DeepMind AI 将挑战《星际争霸 2》,当时 Tim Morten 就直言 DeepMind AI 不会在《星际争霸 2 》中战胜人类。直接目前,这一场人机游戏争霸战,官方都没透露更多的细节。

实际上,《星际争霸》作为一款即时战略类的游戏,给 DeepMind 的挑战比围棋更大。单单是对战局面的数据获取方面,两者就相差巨大。围棋棋盘上就只有数量不等的黑白两色棋子作为数据,而游戏中则包括了双方兵力数量、兵种构成、能力属性、时间等等等。另外作为即时战略游戏,《星际争霸》需要在极短时间内执行策略,而围棋相对来说则有充足的时间给 AI 运算思考。

目前,DeepMind AI 想要打赢《星际争霸》 还是需要更长的时间学习和摸索。

下载品玩App,比99.9%的人更先知道关于「Google」的新故事

下载品玩App

比99.9%的人更先知道关于「Google」的新故事

iOS版本 Android版本
立即下载
杜莉莉

品玩新经济作者,专注创新经济领域的深度报道,对资本市场进行分析。联系邮箱:dulili@pingwest.com

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测