第三章 人机大战:AI真的会挑战人类?

Alpha Go带来的警示是:如果计算机可以在两年内实现大多数人预测要花20年或更长时间才能完成的进步,那么,还有哪些突破会以远超常人预期的速度来临?这些突破会不会超出我们对人工智能的想象,颠覆人类预想中的未来?我们已为这些即将到来的技术突破做好准备了吗?

Alpha Go带给人类的启示究竟是什么?

2016年3月,李世石与谷歌Alpha Go在围棋棋盘上斗智斗勇、激战正酣的时候,我也亲身参与了新浪体育等媒体主办的现场直播。当时,我与棋圣聂卫平九段一起出任讲解嘉宾,直播了李世石与Alpha Go的第五盘棋赛。围棋专家如聂卫平九段的评论视角,显然和我这个计算机科学博士的视角大不相同。但有一点是相通的,那就是绝大多数围棋界人士和人工智能界的科研人员此前都没想到,围棋程序会在如此短的时间内取得质的突破。

记得我曾在接受媒体采访时说过:“Alpha Go真的让我很震惊。如果你是两年前问我计算机何时能战胜围棋世界冠军,我那时的答案大概会是‘20年后’。可计算机在两年内就做到了我认为需要20年才能做到的事,这样的速度真的让人震撼。”

Alpha Go横空出世之前,围棋界的观点也大致相同。因为国际象棋与围棋的复杂度相差甚远,1997年IBM深蓝在国际象棋棋盘上战胜人类棋王的故事并不足以让围棋高手信服。而且,这么多年来,围棋AI程序的研发一直举步维艰。早期基于规则的围棋程序,比如中山大学陈志行教授20世纪90年代研发的“手谈”,基本上只能和围棋初学者过招。直到2006年后,随着蒙特卡洛搜索算法在围棋对弈软件中的应用,Mo Go、Zen、Crazy Stone等程序的棋力才得到了突飞猛进的提高,在国际对弈平台KGS上,2006年到2012年,主流围棋对弈软件的棋力从业余二段猛升到业余五段甚至业余六段56,但也就此停滞不前。Alpha Go出现前,围棋界专家对围棋对弈软件棋力的评估基本比较一致,大多认为最好的计算机程序已可以和业余高手过招,但和职业选手之间,还是有着本质的差别。

在今天的围棋界,业余高手和职业高手之间存在2子以上的明显差距,通常,这个差距是职业选手从童年开始,用10年以上的时间刻苦训练得来的,业余选手极难弥补。另一方面,在计算机科学界,懂得蒙特卡洛搜索算法原理的人都知道,这种算法主要是利用抽样统计来提高搜索效率,单用此算法确实难有提高空间。这是Alpha Go出现前,围棋界和计算机科学界两方面都不敢奢望人机大战即将到来的根本原因。

深度学习改变了一切。

使用深度学习并结合蒙特卡洛搜索的Alpha Go已注定被写入历史。Alpha Go问世的第一年内,其实进入大家视野的是三个版本:5︰0击败樊麾的内测版本,4︰1击败李世石的版本,以“Master”(大师)网名60︰0快棋挑落中日韩高手的版本。三个版本演进脉络明显,每次迭代都有重大升级。最后这个网名为“Master”的版本也基本是2017年Alpha Go挑战柯洁的一个“预览版”。

从围棋角度说,Alpha Go最震撼的是计算机在人类传统认为极其玄妙的、电脑无法掌握的“大局观”上突飞猛进,远远将人类选手甩在身后。电脑计算“大局观”的方式,和人类培养“大局观”的思路,有根本的差别。人类不可能在这方面赶上电脑。和樊麾对局的棋谱基本上还看不出Alpha Go的大局观有多强,和李世石对局就下出了聂卫平赞不绝口的五路肩冲,到了Master的60局,大局观体现在两个地方:

第一,自始至终对局势的把握,比如第60局古力用Alpha Go的思路对付Alpha Go,把中央撑得很满,但Alpha Go不紧不慢,总是恰到好处地保持胜势。

第二,Alpha Go已经深刻影响人类对布局的思考,大飞守角之类的变化迅速被人类棋手模仿,这和当年深蓝问世后,国际象棋的布局革命是一样的。

基于Alpha Go的思路,其他围棋软件的水平也突飞猛进。仅2017年年初就有日本研发的Deep Zen Go和腾讯人工智能实验室开发的“绝艺”达到了人类九段或以上的水平。腾讯“绝艺”不仅面对人类高手保持了绝对优势,还战胜了Alpha Go以外的各路围棋软件,取得了2017年UEC杯计算机围棋大赛的冠军。

以后AI和AI之间的竞赛,应该会不断促进AI提高。人类虽望尘莫及,但可以不断从AI中学习新的思想。

从人工智能技术的角度说,Alpha Go用的是AI领域应用非常普遍的算法:深度学习、蒙特卡洛算法、增强学习等。可以说,机器视觉相关的深度学习技术,包含环境—决策—反馈的智能系统,里面都有Alpha Go的影子。当然,直接的代码实现层面,肯定没有复制、粘贴这样直接借用的关系,因为Alpha Go的深度学习模型毕竟是围绕围棋的特征建立的。