击败围棋高手 人工智能还是没人类聪明

15.02.2016  09:11

谷歌旗下一家公司研制出的人工智能程序“阿尔法围棋”在比赛中完胜欧洲职业围棋冠军樊麾二段。资料照片

近日,人工智能又一次成为媒体和公众关注的焦点:谷歌旗下一家公司研制出的人工智能程序“阿尔法围棋”(AlphaGo)在比赛中5:0完胜欧洲职业围棋冠军樊麾二段,在这种复杂度最高的棋类游戏上,人工智能显示出有望超越人类顶尖高手的“智力”。今年3月,AlphaGo将挑战世界冠军李世石九段。

1997年,IBM开发的计算机程序“更深的蓝”在六局棋比赛中,击败国际象棋棋王卡斯帕罗夫,成为载入史册的人工智能突破。然而,围棋的复杂度远远高于国际象棋,前者最多有10的约170次方种局面,后者的最多局面仅为10的约47次方种。近年来,人工智能有了什么发展,才有底气与职业围棋选手一较高下?它能否击败围棋世界冠军?如果击败,意味着什么?对于这些问题,专家给予了解答。

  深度学习“消化”

  2000万局棋

复旦大学哲学学院教授、人工智能哲学专家徐英瑾介绍,传统的计算机下棋程序的基本原理,是有限步数的搜索树,即采用数学和逻辑推理方法,把每一种可能的路径都走一遍,从中选出最优解。显然,这种下棋思考方法是人类无法做到的,发挥了计算机速度快、运算量大的优势。不过,这种“暴力算法”并不适用于围棋。据计算,围棋每回合有250种可能,一盘棋可长达150回合,所以围棋最多有10的170次方种局面。即便对计算机而言,这个运算量也是相当大的。

除了复杂度高,围棋还有一大特点——黑白两方棋的每个棋子是一样的,没有大小之分、角色之别。这给计算机程序的运算推理带来了很大难度,因为从哲学上看,围棋具有“语境敏感性”,不太适合逻辑推理; 而棋子各不相同的中国象棋、国际象棋具有“超语境性”,每个棋子角色明确,不因棋局的变化而改变,非常适合逻辑推理,这正是计算机的强项。

近年来,不同于搜索树的深度学习技术逐渐成熟,给围棋程序的研发带来了突破。深度学习源于人工神经网络,其模仿对象是人脑。研究表明,人脑由约10的11次方个神经元构成,神经元细胞的外表有很多突起。其中,比较短的放射性突起叫“树突”,外形似树枝分叉,具有接受刺激并将冲动传入细胞体的功能。而要把信息向其他神经元输送,就得依靠“轴突”。人工神经网络从信息处理角度对人脑神经元网络进行了抽象和模拟,建立运算模型。这种网络由大量模拟神经元的节点相互连接构成,每个节点代表一种特定的输出函数,称为激励函数。每两个节点间的连接,都代表一个对于通过该连接信号的权重值,形成人工神经网络的记忆。网络的输出则根据连接方式、权重值和激励函数的不同而不同。

“深度学习系统是人工神经网络的升级版。”徐英瑾解释说,这种系统由输入层、中间层和输出层构成,其中,中间层由多层人工神经网络构成,可多达七八十层,故名为“深度学习”。每增加一层,就意味着增加了一个人工智能分析维度。当人把某种大数据样本输入系统后,这种系统即可进行学习,掌握样本中蕴含的规律。为了让 Al-phaGo具有一流的围棋水平,谷歌科研人员输入了2000万局棋谱。假如一个人要学习2000万局棋,每局棋耗时15分钟,他需要一刻不停地下570年!

  战胜围棋世界冠军

  是迟早的事

Facebook 专家也在研发围棋程序,但谷歌走在了他们前面。看了谷歌专家近日以封面形式发表在《自然》上的论文后,Facebook人工智能组研究员田渊栋博士表示,从算法上说,这篇文章并没有太多新意,主要是通过大量训练数据,包括以往的棋谱和自我对局,把性能“堆”出来。谷歌团队训练了一个走子的神经网络,又训练了一个可以评估局面的网络,然后在“蒙特卡罗树搜索”中同时使用这两个网络。香港科技大学计算机科学硕士陈经介绍,采用“蒙特卡罗树搜索”这种算法,是围棋程序在采用深度学习系统之前的一次突破。2010年左右,开发者们引入“蒙特卡罗树搜索”,其特点是模拟棋局一直到下完算子、判断胜负,模拟多次后,看哪个选点的获胜概率最高。模拟时,会利用“棋形”等经验减少选点,一直模拟下去直至终局。时间不够或电脑计算能力不足,模拟的局面数就少,棋力就低。由此可见,这是一种基于概率的“暴力搜索”算法。

如今,AlphaGo将“暴力搜索”与“大数据+深度学习”结合在一起,取得了突破。经过2000万局“自我对局”训练,它拥有了击败职业棋手的能力。“这个训练规模,我实在没有想到过,谷歌在这方面是很有优势的。”田渊栋坦言,他们的“默认策略”也是经过处理的,能够仅耗时2微秒就走一步,而且准确率也不错。总之,谷歌的做法充分利用了“大数据+深度学习”的优势,而且几乎完全未用到围棋的专业知识。“若是以后棋力能再往上走,我也不会惊讶。”

不断学习、不断进步的Al-phaGo,今年能否战胜李世石?华东师范大学计算机系贺樑教授认为,有这个可能,即使今年没有战胜,计算机程序击败围棋世界冠军也是迟早的事。这是因为,计算机的运算速度比人脑快得多,能凭借“大数据+深度学习”在短期内分析完一个人一生也无法穷尽的棋谱,棋力提升的速度和幅度会很惊人。

  打造“通用人工智能”

  需新算法

在不少人看来,如果 Al-phaGo击败围棋世界冠军,意味着人类将丧失在棋类游戏中最后的尊严。对此,徐英瑾认为大可不必妄自菲薄。从训练棋局数量与围棋水平的“投入/产出比”来看,人工智能还是没有人类围棋高手聪明。要知道,Al-phaGo可是训练了2000万局棋后,才能战胜职业围棋二段选手。而一个人在成长为职业九段高手前,训练的棋局数量远小于2000万。从这个意义上说,人工智能程序的聪明程度远不如大多数人,尽管拥有了深度学习能力,但它战胜人类的主要原因仍和以前一样:运算速度快、不受生物属性限制。

因此,我们不必沮丧,而是要为人工智能技术的进步感到欣喜。谷歌团队表示,他们打算利用研发AlphaGo过程中的技术来解决一些当今社会的重要问题,如医学诊断、全球变暖。自然语言理解,也是人工智能研发的一个重点领域。目前,代表这一领域国际先进水平的苹果手机Siri,在与用户对话时,仍显得较为幼稚,有时答非所问。谷歌、Facebook、微软、百度等许多知名互联网企业都在投入重金,开展研发,以期在人机问答领域取得突破。

徐英瑾表示,AlphaGo击败围棋高手,也许还称不上人工智能领域的重大突破。人工智能唯有能模仿“整全的人”,具备人类思维的大多数功能,才是真正震撼人心的事件。他分析说,计算机程序的许多单项能力早已超越人类,即使是一个小小的计算器,其算数能力也非人类可比。计算机程序如今成为围棋高手,不过是增加了一种单项能力。与之相比,实现“通用人工智能”的难度高得多,要求一个人工智能系统,可以像人一样做很多事情:做算术、写文章、画画、下棋……这种系统能处理生活中纷繁复杂的情况,如果科学家能开发出一套优质的家政服务系统,能让机器人独立做各种家务,那么它就基本可算作通用人工智能。

贺樑和徐英瑾都认为,“大数据+深度学习”技术并不能打造出通用人工智能系统,科技界需要开发出新的算法和技术,更好地模拟人脑工作方式,才有望把人工智能推向新的高度。记者 俞陶然