人工智能想在《星际争霸》上打赢人类还不可能,不过 Google 和暴雪已经开始尝试了

年初,Google 的阿尔法狗(AlphaGo)震惊了全世界, 关于人工智能的讨论也来到了顶峰,“击败最优秀的人类棋手”,这个充满了传奇色彩的事件其实让很多人高估了人工智能的威力。在那之后,就有很多消息称,阿尔法狗接下来要挑战《星际争霸 2》,人工智能战胜职业选手指日可待。

今年 3 月,很多中国媒体更是报道,在 WCS 中国站决赛上,暴雪娱乐制作总监 Tim Morten 亲自确认,AlphaGo 确认将挑战《星际争霸2》。

这个新闻有两个疑点:第一,几乎没有国外媒体以 “AlphaGo 挑战《星际争霸 2》”为标题进行报道;第二,AlphaGo 的名字也显示了,这只是 DeepMind 为围棋项目(英文:Go)专门训练的人工智能项目,如果挑战星际,应该不会是这个名字。更准确的是当时《财富》的报道:DeepMind 的 CEO,Demis Hassabis 表示,《星际争霸》是一个考虑中的有趣的挑战。

现在,DeepMind 和星际的“绯闻”终于可以落实了。DeepMind 的工程师 Oriol Vinyals 在公司博客宣布,暴雪将和 DeepMind 展开合作,让《星际争霸 2》成为人工智能和机器学习的研究环境,并在明年第一季度将这个环境开放给所有的人工智能研究者。也就是说,即使是 DeepMind 的人工智能,也刚开始学习《星际争霸 2》。

Oriol Vinyals 少年时期曾是西班牙的顶级《星际争霸》玩家,他坦诚,“要打败人类职业选手,我们还有很长的路要走。”

和回合制的围棋不同,《星际争霸》是即时战略类游戏,游戏中,玩家需要从三个种族之中选择一个进行游戏,而每个种族都有不同的优缺点。针对不同的情况快速反应,同时有对战局的长期规划,这对人工智能程序来说是个非常艰巨的挑战。

wall3

在和李世石对弈时,AlphaGo 借鉴了蒙特卡洛树搜索算法,评估下一步的可能最优解(可以排除一些对自己不那么有利的可能),以减少搜索深度。即便如此,拥有超强计算能力的 AlphaGo 落子前,还是需要很长的思考时间。

另外,和围棋不同,在《星际争霸》中,人工智能能获取的对手的信息是有限的(比如游戏中未探索地区的战争迷雾,其中的情况对手是看不到的)。

你可能想到了《星际争霸》中自带的 AI,也就是电脑玩家。它的工作机制其实和现在的人工智能完全不同,因为游戏里的 AI 是直接从游戏代码中获取信息的,而且,它可以同时对所有单位下达指令,即使有些单位不在屏幕中。和人类玩家相比,它其实是在作弊。

DeepMind 和暴雪的目标是训练出遵守规则,同时可以和人类玩家一较高下的 AI 系统。

所以,DeepMind 将和暴雪合作改进游戏环境,新的游戏界面将《星际争霸 2》的游戏画面简化成基本的视觉图形(如下图),以供机器学习系统更好地学习,当然,这也就意味着,人工智能系统是以视觉而不是直接读取游戏数据为基础进行决策的,这和人类玩家完全一样。

starcaft

另外,暴雪还会提供游戏回放,以供人工智能系统学习。

暴雪和 DeepMind 都明白,让人工智能击败顶级的职业电竞玩家还非常遥远,不过就像 AlphaGo 在很多人都不看好的情况下完胜李世石,这一天很可能会比大家想象中的早来一些。当然,DeepMind 的终极目标是解决现实生活中的问题,而相比围棋,《星际争霸 2》是一个和现实世界更接近的环境。

订阅更多文章