返回列表 发帖

又是围棋……人工智能为什么总喜欢挑战棋手?

2017年5月23日   弈客头条

又是围棋……人工智能为什么总喜欢挑战棋手?-人工智能领域如此喜欢挑战博弈游戏不是没有道理的



今天(5月23日),deepmind的围棋程序AlphaGo在以4:1战胜韩国围棋国手李世石1年多以后,再次来到围棋的发源地中国,挑战当今世界等级分排名第一的年轻棋手柯洁,而5个多月之前,AlphaGo更是在几大围棋对弈网站上用“Master”的账号,在30秒1手的网棋(其中挑战棋圣聂卫平的1局采用1分钟1手)中,以60连胜的战绩碾压其挑战的全部职业高手。

与网棋不同的是,此次AlphaGo在浙江乌镇与柯洁的比赛采取每方用时3小时,5次1分钟读秒的慢棋,共比赛三局,如果柯洁赢2局战胜AlphaGo,将获得高达150万美元的奖金,否则只有30万美元的出场费。这次新的人机大战,围棋界虽然在AlphaGo战胜李世石之后对计算机围棋进行了更多研究,但仍然普遍持有悲观态度,著名围棋国手古力甚至预测柯洁三盘棋当中赢一盘的概率只有10%。


既然明知是一场实力悬殊的赛事,为何deepmind仍然如此重视?战胜李世石之后,deepmind从商业角度而言,在人工智能产业内已经如日中天,再举行这样一次人机大战的意义何在?

我们当然可以从外部的原因去揣度,例如围棋是亚洲流行的博弈游戏,deepmind可以借此扩大其在亚洲的影响和提升品牌。但是包括Facebook、腾讯等多家国内外的知名互联网公司在最近1年多也涉足这个领域,腾讯AI实验室研发的“绝艺”更是在今年3月夺得UEC杯计算机围棋大赛冠军,在网络上具备了与职业9段对抗的实力,而人工智能学术界早在1974年就举办了世界计算机象棋锦标赛,1977年成立了国际计算机象棋协会,并于2002年更名为国际计算机博弈游戏协会(ICGA:International ComputerGame Association),该协会不仅每个季度出版计算机博弈领域的权威学术刊物ICGA会刊,而且还接管了从1992年开始的计算机游戏奥林匹亚大赛(Computer Olympiad),该大赛已经主办了19届,仅限计算机游戏程序参赛,比赛项目包括角力棋、西洋双陆棋、中国象棋、围棋、中国象棋盲棋、桥牌等世界各地流行的17种棋牌游戏。显然人工智能界对游戏的爱好由来已久,即使没有deepmind的AlphaGo,这么多年来科学家对于开发强大的计算机游戏程序一直是乐在其中。

我们再追溯人工智能和计算机的发展历史,从计算机的先驱巴贝奇开始到德国人楚泽,都设想过用计算机来完成象棋对弈这样不是传统计算范围之内的智力任务。二战后控制论、信息论的奠基人维纳和香农,以及计算机科学的主要奠基人冯·诺依曼、图灵,都对计算机博弈尤其是国际象棋有着浓厚兴趣,维纳在其名著《控制论》中描述了一个带局势评价函数的象棋程序,香农发表了计算机编程下棋的论文,而图灵甚至用纸和笔手写开发了一个象棋程序。人工智能学科的主要奠基人赫尔伯特·西蒙和艾伦·纽厄尔,在50年代中期也开发了象棋对弈程序,IBM在50年代的人工智能研究中就已经开始研究博弈游戏(塞缪尔的西洋跳棋、伯恩斯坦的国际象棋)。

人工智能领域如此喜欢挑战博弈游戏不是没有道理的,主要有以下几方面的原因:

>>>>  一、西方文化中的理性主义传统。自从古希腊哲学家亚里士多德提出“人是有理性的动物”以来,理性长期以来被认为是人类和自然界其它生物的核心区别,而理性的概念,经过中世纪教会哲学家如托马斯·阿奎那等人的阐释,逐渐与抽象、演绎推理的逻辑思维能力高度关联起来,而人工智能的目标是让计算机完成只有人类才能完成的任务,博弈游戏不仅是由人类发明的,而且在游戏过程中充分体现了博弈双方的逻辑推理和计算能力,这些抽象能力从传统上来看,显然只有人类这样有理性的物种才具备。基于这个原因,西蒙在自传中回忆,他和纽厄尔在1956年标志人工智能诞生的达特茅斯会议之前,本来是想开发国际象棋程序来演示计算机完成智力任务的能力,但当时他们认为对棋局的识别需要处理图像,而这个任务无论在理论方面还是早期计算机的计算能力方面都不成熟,因此就选择了罗素和怀特海合著的《数学原理》一书中命题逻辑定理证明的内容,该书作为现代数理逻辑的巨著,在当时属于典型的“高大上”,理工科的大学生以读过此书并完成书中的证明题目作为荣耀,因此如果计算机能证明该书中的定理,那显然也具备了人类的理性能力。后来随着计算机能力的提高和理论的完善后,人们才开始不断地在西洋跳棋、国际象棋等博弈游戏领域开展研究。

>>>> 二、与复杂的真实场景相比,计算机博弈游戏的复杂度和难度相对较低,容易在技术上得到验证和取得进步。西蒙把国际象棋作为认知科学和人工智能研究的基本工具,就象遗传学中的果蝇一样,虽然围棋比国际象棋的复杂度更高,其状态空间复杂度是10170(国际象棋是1046),博弈树复杂度估计为10360(国际象棋是10123),但是其任务本质上并无不同,例如都是对弈双方在完全信息下的动态博弈。人工智能和认知科学哲学家休伯特·德雷福斯在其名著《计算机不能做什么》中将人类智能活动由易到难分为4类:反射性行为、数学思维、复杂的形式化系统、非形式化行为或感知思维领域,而围棋、象棋等博弈游戏,属于复杂的形式化系统,按德雷福斯的观点,传统人工智能基于计算、符号和推理的研究路径,可以部分地解决这个领域的问题。换而言之,计算机博弈尤其是围棋游戏虽然比较复杂,但还是可以用符号将游戏规则、局势抽象化地表示出来,从而利用计算机擅长处理符号计算的优势予以解决。如果围棋的人机大战中,机器战胜了人类,那么意味着至少在和围棋复杂度类似的任务环境,例如股票交易、芯片设计和测试、车间任务调度等领域,人工智能将比人类完成得更好。

>>>> 三、通过解决围棋等复杂博弈游戏问题,为人工智能实现并超越人类智能在技术上积累经验。即使目前计算机的运算能力大大提高,但是对于围棋这种复杂度的游戏而言,仍然无法进行完全穷尽的蛮力计算。对于对局中下一步的走法,软件仍然不得不采用各种方法进行筛选(即所谓的“剪枝”),筛选的方法可以是蒙特卡洛模拟,也可以是左右手互搏的生成对抗网络(GAN:Generative AdversarialNetworks),而从人类积累的数百万局棋局中学习,则用到了深度学习方法。AlphaGo在人机大战中的胜利,不仅是其有强大的计算能力,更是因为其在软件设计上的进步。当这些方法在博弈游戏中得到验证后,商业巨头就可将其推广到可以获利的应用场景。


但是反过来,博弈游戏也可以检验人工智能不足之处的另一个试金石,在西洋双陆棋游戏中,由于是通过掷骰子来决定下一步,因此情况就比较复杂,在这个领域计算机程序虽然战胜过人类冠军,但和西洋跳棋相比还不能说超越人类。同样,如果围棋游戏中引入彩棋机制,即要求胜方尽可能地多赢子,而不是只要赢就行,那么对局势评价函数就形成了新的挑战。而真实的应用场景比博弈游戏还要复杂得多,例如难以用符号形式化表示的图像识别,法律文本的理解,政府的公共决策等领域。另一个更大的问题是在计算机的能耗上,人脑只有1.4千克左右,而AlphaGo则使用了近2000块中央处理器(CPU),以及几百块图形处理器(GPU),因此相对人脑而言,计算机的效率还是非常低,这说明人脑的智能行为机制与计算机还存在很大不同。

博弈游戏可以抽象为基于规则的系统,从原理上来看,只要通过对海量棋谱的学习,配合蒙特卡洛模拟这样的剪枝方法以及局势评估函数,AlphaGo在强大运算和搜索能力的支持下,人类战胜人工智能的希望几乎没有,例如2007年研究者在《科学》杂志上发表论文证明西洋跳棋程序“奇努克(Chinook)”在理论上已经不可能被人类击败。虽然如此,在实际生活环境这种难以全部形式化为规则的情况下,即使计算机能在围棋上战胜人类,人工智能仍然有很长的路要走,因此计算机博弈游戏领域仍将成为一块试金石,人们期望能从中获得成功的启发和失败的教训,使人工智能的水平能早日达到或超越人类。


注:西洋跳棋程序Chinook已在理论上被证明其能力高于人类棋手,而围棋和国际象棋程序只是在比赛中战胜过人类顶级高手,严格来说并未超越人类。

作者为上海交通大学博士生,计算机科学和人工智能史研究者。文章观点不代表主办机构立场。

(弈客编辑YK009)
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表