在“世界上最复杂的棋类游戏”围棋上,Google人工智能再次碾压人类

尽管人工智能已经在很多方面打败人类了,比如国际象棋,但是围棋,一直被认为是人类仍然在机器面前能保持优势的游戏之一。

过去20多年来,科技家们一直在试着教会电脑下棋,在1997年,IBM的深蓝曾经打败了国际象棋的世界冠军Garry Kasparov,这成为了人工智能的一座里程碑事件。但是,围棋比国际象棋还是要复杂得多,国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;相比之下,围棋每回合有250种可能,一盘棋可以长达150回合。可以想见,如果人工智能打败了人类最顶尖的围棋选手,这将成为人工智能发展的另外一座里程碑。

但现实是,在过去很长时间里,最好的计算机连厉害点的业余围棋棋手都下不过。所以,去年,Facebook就开始打造围棋人工智能,并且在过去6个月里让它可以用最快0.1秒的速度来落子。负责这项目的人,就坐在里扎克伯格20英尺远的地方。

12597703_942271465807927_1227282329_n

但是,Google还是快一步。

最权威的科学期刊《自然》杂志刊发了Google的围棋人工智能“阿尔法Go”(AlphaGo)的最新进展:它让计算机在没有任何让子的情况下,以5:0完胜围棋欧洲冠军樊麾。

2

这场比赛实际上发生在去年十月,但是知道今天,它才在《自然》杂志中披露出来。

阿尔法Go的研发者是Google位于伦敦的人工智能团队DeepMind,它的负责人Demis Hassabis在接受英国《独立报》采访时说,

这是第一次,计算机在一块全尺寸棋盘、没有任何让子的情况下,赢了职业围棋选手。

这个比赛结果,意义相当重大。“围棋有可能是人类玩的最复杂的棋盘类游戏。”Hassabis 说,“但是阿尔法Go还是赢了,它比我们预料的还要强大。”

“阿尔法Go自己学会了很多规律和走法。围棋被认为是人工智能研究的顶峰,是圣杯。对我们来说,这是难以抗拒的挑战。”

在下国际象棋的时候,计算机可以分析出每一个可能的步骤,从而进行最优选择,但是,围棋可能的步骤是国际象棋的10倍之多。这也正是围棋人工智能的难点所在。

David Silver是这项研究的第一作者,在他看来,阿尔法Go的关键不在于简单粗暴的计算出可能步骤,而是近似于人类的“想象力”。这背后是名为一项名为“深度学习”的大杀器,它让计算机不再是简单地使用计算能力来统计所有数据,而是像人类一样,训练,然后学习。Silver说,计算机“下围棋需要的极复杂的直觉机制,这种机制以前我们认为只可能存在于人类大脑中。”

Google-Nature-chess-300x394

阿尔法Go用了多种“神经网络”并行,并且相互作用。其中,一个叫做“值网络”(value network),来衡量白字和黑子在棋盘上的位置,一个叫做“策略网络”(“policy network” ),会不断地学习此前人类和自己的落子,来选择接下来怎么下。

“人类在一年里只能下1000盘棋,但是阿尔法Go可以在一天就下几百万盘。它有强大的处理能力,不断获得训练,所以阿尔法Go可以到达人类远远达不到的境界。”

不仅仅比人类、比起其他机器人同类,阿尔法Go也更加强大。它和其他人工智能下了500场围棋,只输了1场,甚至在给对手让子的情况下,它也照赢不误。而Silver说,它比其他人工智能更先进的地方,就在于可以自我学习。而且,这种机制不仅仅可以用在围棋学习中,阿尔法Go还可以用来解决很多现实问题,比如处理气候模型等。

“它就像人类一样在学习着,不过需要更多练习。一个人类可以在几局棋里学到的东西,它必须通过几百万盘才能学到。”

然而那又有什么关系呢?下几百万盘棋,对它来说也不过只用一天的时间而已。在去年十月这场比赛之前,最好的计算机连厉害点的业余围棋棋手都下不过,所以很多人预测,计算机要打败真正的围棋高手,至少还需要5到10年的时间,但是,这一天已经提前这么久到来。

可能有人说,欧洲冠军樊麾无法代表围棋界世界最顶级的水平。但是在樊麾看来,

如果没有人告诉我,可能我会认为和我下棋的是一个有点古怪但是非常厉害的对手,一个真正的人。

那好吧,另外一场更关键的较量也即将发生:Google的“阿尔法Go”V和现在的围棋世界冠军李世石 (Lee Sedol),将在今年三月正式进行比赛。在围棋这个古老的、几乎代表了人类智力巅峰的游戏上,机器人和人类究竟谁更强大,答案很快就会揭晓。

李世石说他很期待在三月的时候和阿尔法围棋较量。他说,

我听说了Google DeepMind的人工智能出人意料地强大,而且正在变得越来越强,但是我很信心,至少这一次,我可以赢。

而DeepMind的负责人Demis Hassabis同样说,

我们非常有信心。

 

订阅更多文章