DeepMind AI 想要在《星际争霸》打赢人类，还是太天真了-品玩

在 AlphaGo 战胜了韩国围棋棋手李世石后，DeepMind 创始人戴密斯·哈萨比斯（Demis Hassabis）就曾表示将研究以人工智能与人类玩其他游戏，例如即时战略游戏《星际争霸》。不过目前看来，DeepMind AI 要跟人类比赛打《星际争霸》这事，还是有点儿悬。

早在 2015 年，DeepMind AI 就开始用已经雅达利 1977 年发行的游戏机 Atari 2600 来进行游戏训练，整个训练过程团队没有提供任何额外信息帮助，全依靠 AI 自己来一步步学习如何打怪升级。在这些游戏里，有一款游戏始终让 DeepMind AI 很苦恼，那就是《Montezuma’s revenge》，这是雅达利一款难度超高的游戏。

后来团队找到了“好奇心”激励机制，来让 DeepMind AI 获胜。他们给 AI 变成编程输入“人工好奇心”，在 AI 探索更多的玩法的时候给予它更多的奖励，鼓励它去用不同的途径来获取更高的分数。在新版本里，DeepMind AI 在好奇心的驱动下探索了 15 个房间的游戏。在没有好奇心的时候，它只玩了 2 个房间。

今年 3 月底，在 AlphaGo 五局四胜赢了李世石之后，暴雪娱乐制作总监 Tim Morten 就在 WCS 中国区总决赛上确认，DeepMind AI 将挑战《星际争霸 2》，当时 Tim Morten 就直言 DeepMind AI 不会在《星际争霸 2 》中战胜人类。直接目前，这一场人机游戏争霸战，官方都没透露更多的细节。

实际上，《星际争霸》作为一款即时战略类的游戏，给 DeepMind 的挑战比围棋更大。单单是对战局面的数据获取方面，两者就相差巨大。围棋棋盘上就只有数量不等的黑白两色棋子作为数据，而游戏中则包括了双方兵力数量、兵种构成、能力属性、时间等等等。另外作为即时战略游戏，《星际争霸》需要在极短时间内执行策略，而围棋相对来说则有充足的时间给 AI 运算思考。

目前，DeepMind AI 想要打赢《星际争霸》还是需要更长的时间学习和摸索。