返回列表 发帖

从鲍云的最强大脑之行谈起——围棋究竟难在哪?



作者:公孙青阳  来源:知乎  2015-03-09
链接:https://zhuanlan.zhihu.com/p/19971628

数日前,北京棋界著名业余豪强鲍云6段登陆最强大脑节目并挑战蜂巢迷宫成功,在棋界内外引起了广泛热议。在其获得节目第二赛季首个满分的同时,棋界也不断传出对其天赋和能力的由衷赞叹,称其为棋界骄傲的声音不绝于耳。在笔者这样的天然路痴对其卓越的空间定位能力击缶叹绝的同时,周围的朋友也就其本人赖以成名的多面打盲棋和蜂巢迷宫孰难孰易展开了激烈的争讨。本文谨从蜂巢迷宫和围棋二者难度的异同出发,简析围棋这一古老游戏经久不衰却始终未能被人工智能攻克的原因,以及笔者对于围棋发展的拙望。一家之言,还望读者大力斧正。

蜂巢式的迷宫架构,最早出自于美国著名认知行为心理学家托尔曼,其提出的认知地图模型在近年的经济心理学界炙手可热。师从德国心理巨擘考夫卡的托尔曼深受完型主义的影响,始终坚信有机体的所有外显行为都依赖于其内部形成的以期待和目的为终点的认知地图(即S-O-R模型,有兴趣的读者请自行查阅相关文献)。简单来讲,在解决蜂巢式问题的过程中,人们需要根据环境对自身行为做出的反应(证实之前的预期或者否定之前的预期)来不断完善自身脑海里的认知地图,并将该地图作为唯一的行为导向逐渐趋近问题的终点。从最强大脑节目中的蜂巢迷宫的路径设置来看,挑战者的每一步都可以通过六扇门的开关状态来判断之前一步的正确与否(正确途径有且仅有一条),因此在具有充沛体力、良好记忆、严密逻辑和充分时间的前提下,参赛者只需要按部就班逐层推进,就可以根据每开一次门面临的情况反推上一次开门的正确与否来进行迫选,进而一步步最终达至迷宫的终点。因此,笔者认为此次挑战的最大难点,反而仅仅在于鲍云的蒙眼操作了。

也正因如此,笔者相信鲍云最擅长的盲棋技术的难度,远非区区一个极简状态下的蜂巢迷宫可比,鲍云在后来的采访中提到的“这次迷宫挑战可能仅仅利用到我本人60%潜力”等相关言论也从侧面证实了笔者的这一观点。所谓盲棋,亦即棋手通过单纯的口头报告完成棋局,而不能使用眼睛和手来进行观察和落子。前文中笔者已经提到视觉线索对于人类参与任务完成的激活脑区(学名工作记忆系统)具有几乎不可替代的重要作用,而相较于中象和国象的8*8棋盘,围棋的19*19路棋盘因坐标报告带来的额外记忆负荷量显然更加夸张。更有甚者,鲍云作为围棋盲棋的世界第一人,在盲棋对局中几乎能保持业余6段的水准且曾完成过以一敌十的惊人壮举;这在具有相当的围棋水平之后,才更能体会出其困难之处。在与周围一些棋界朋友的讨论中,笔者发现有相当多的棋手朋友认为蜂巢迷宫的难度比盲棋更甚,这很有可能是因为他们是具有相当水平的职业棋手。由于高强度的经年累月的围棋训练,使得这些棋手在下围棋时的许多思维过程已经不再需要意识的参与,反而成为一种自动化的加工,棋手本人也就无从探知了。而如果我们将围棋所需的思维过程进行一一细分,则该问题的答案跃然纸上。

首先,笔者始终认为围棋作为可能是世界上最复杂游戏的原因,就在于围棋胜负判断的动态性和不确定性,这也是围棋时至今日依然未能被人工智能所攻克的重要难题。相较于中象、国象和五子棋,围棋的规则最为简单,而这种简单也直接导致没有一条明确的规则能够划分每一盘棋局的胜负。不论象棋中的攻防和换子如何繁杂,整个棋盘中始终有一个坐标点是己方绝不可能让出的(即己方王/将的位置),可以直接到达该位置的敌方棋子的评分为无穷大。由此,在任何的棋局状态下,棋盘上的敌我每一颗棋子,都可以根据自身的行动规则和与敌方王子的位置关系进行动态评分,进而得出形式优劣。接下来,人工智能就可以以当下的子力评分和行形势态为基础, 去计算各种着子的可能下敌我子力评分变化的高低,并最终选择一种最有利于扩大敌我得分差的着法,并不断重复这个过程,直到己方获得无穷大的评分为止。这是象棋中人工智能最基本的工作原理,而它早在数十年前就已经得到了实现。事实上,我们也可以看到在当今的大数据时代下,这种数据开发和挖掘的算法显然十分简易;当今的中象、国象和五子棋界,都已经必须要采取强制的规则和手段来尽可能降低人工智能对棋局的不公正影响。换言之,在这些棋类的世界中,人类早已不是人工智能的对手。反观围棋,由于“地大为胜”这一规则的模糊和不确定性,导致棋盘上没有一个无穷大得分点作为基本评分标杆,因此每一手棋的评分就变得无比艰难,当下的形势判断也难以形成。在对棋子评分艰难的同时,由于没有无穷大得分点的存在,这样的评分计算也无法找到一个明确的终点,而没有终点意味着途径的缺失;没有起点评价,没有终点目标,甚至没有可行途径,再强大的计算能力也无从下手。为了克服这些困难,人类棋手逐渐发明了先宽后窄、先大后小、势地均衡等利用复杂的认知系统来进行的概念代替了单纯的计算工作,在近百年来的数次围棋技术革命中逐渐找到了更加合理的评分体系。因此,在电子科技高度发达的今天,最先进的人工智能软件也只能和非常低级的人类棋手相抗衡,使得围棋成为了世界范围内仅存的数块人工智能至今难以染指的乐土之一。当然,笔者有足够的理由相信,随着认知神经科学的不断发现,终有一天,这些认知概念和过程的基本化学原理将被发现,那也应该是围棋这个项目的最终归宿。关乎这一话题的讨论在后文中有所涉及,在此不表。

除了没有明确的终点以外,围棋的另外一大难点就是信息采集的主观性,这也是包括球类、棋类等一系列对抗性竞技项目的最大魅力所在。正如前文提到的那样,选手在完成蜂巢迷宫的过程中,由于正确路径的唯一性,其前进的每一步都可以根据接下来六扇门的开关状态来反推前一步的正确与否,进而根据该判断来决定接下来的行动方向。其实,不光是蜂巢迷宫,在人类从事的大量工作中,及时正确的反馈都将起到具足轻重的作用。然而不幸的是,在围棋这样的二人对抗性项目中,反馈的作用却显得如此单薄。一方面,由于前文提到的评分体系的不完善,棋手本身对于形势和上一着的好坏判断都是主观且不健全的,这带来的直接后果就是棋手对于决定下一手落子位置所必须考虑到的可能性判断数量绝非线性递增,而是呈指数级急剧上升。另一方面,由于竞技体育的对抗性带来的非胜即负二元世界观,对手在对棋手着法进行反馈时,常常会给出一些与事实相悖的信息,这也给棋手利用这些信息得出下一手的过程制造了巨大的麻烦。反馈信息的主观性、不健全性和谬误可能,使得棋手对于之前行棋的正误判断举步维艰,也使其对接下来的棋局进行的所有判断都成为了可能性推断——这不光意味着思考容量的剧增,也意味着棋手无法对自身之前的表现有比较客观地认识。当然,这种无法依靠单纯算法解决的推敲之处也正是诸如围棋、德州扑克等竞技项目在近年愈发热门的独特魅力所在。通过自身的行为去影响对手并因此获得最终胜利的过程,参与者能体验到大量的成就感与挫折感(即被征服感或无望感,现代心理学研究表明挫折感跟焦虑一样具有重要的生理作用,同时也是成就感的一部分,对体会到成就目标也会起到重要作用),进而获得高峰体验,在高度的生理唤醒状态下获得心理的满足。顺便提一句,这也是球类、棋类等竞技项目在当今世界远比文化艺术流行的原因之一:客观标准的存在使得每一次的参与都能获得明确的成就感或挫折感,这在获得丰富的人生体验的同时也能不断发展个体的认知世界观,完善自我。相较于竞技世界,文艺世界中大牛的高自杀率或多或少也能成为这种理论的一个证据。毛主席的“与人斗,其乐无穷”,同样是这个理论最好的诠释。

另外,广泛应用于象棋人工智能中的模式识别算法在围棋中不再适用,也是围棋这个项目显得非常困难的重要原因之一。笔者在课余生活中偶有教棋经历,在对每一个小孩的授课之前都会反复向其强调:围棋是不断变化的游戏,千万不能认死理。哪怕是棋界公认的众多所谓定式,也都要受到整个棋盘内其他每一颗棋子的影响。忽略了棋盘中其他子力的影响而把围棋的任何一个局部单独挖掘出作为评价单位,显然差之毫厘谬以千里。围棋对锻炼小孩大脑的开发也正是如此——随时随地的变化状态要求参与者必须有高度的精神专注和逻辑分析能力,在面对不断变化的不同环境中对敌我双方的优劣状态进行不断分析和评价,才能在一盘漫长的围棋竞技中取得最终的胜利。

正是因为围棋有如此众多的困难之处,所以笔者坚持认为:哪怕是今天的围棋发展,也仅仅停留在非常低级的地步。记得小时候学棋的一天,笔者突发奇想问老师:既然围棋最终有一天要分出胜负,那为什么还会出现双方都可以接受的定式呢?既然总有一个人要失败,那定式的某一方不是一定会或多或少吃亏吗?由于年代久远,当时老师的回答已然模糊,不过这个问题萦绕笔者脑海十数年未曾消褪。作为一个由里到外的纯理科生,笔者始终相信数据是世间万物的基础,围棋也绝不例外。既然围棋的唯一目的就是击败对手获得最终的胜利,那么所谓的均衡或是两分,就仅仅是还没有足够能力的个体对混沌现实的一种妥协罢了。熟知当代围棋发展的读者应该会知道,哪怕是二三十年前的众多公认的不可置疑的“定式”,在今天都已经无数次被否定被推翻,形成许许多多面目全非的新“定式”,而这些更替的原因,就是棋手在对于定式之后的变化研究中有了更新的发现。那我们又有怎样充分的理由,去武断相信今天的所谓绝无争议的“定式”或是判断方法,在未来的某一天就一定不会被更为精细和科学的研究所否定呢?在笔者的经验中,当今的职业棋手时常挂在嘴边的一句话就是“胜负不在这里”;如果从围棋的本质上看,一盘棋的前面的着法直接决定着之后的每一步进行,胜负怎么可能不在这里呢?因此,笔者认为,今天的棋手们对围棋的认知,仅仅是建立在个体以往胜负经历下的一种可能性判断,这样的经验主义的判断体系显然是不够科学和合理的。我们所谓的好棋或是坏棋,仅仅是根据过去出现过的类似棋型在统计学上获胜频率的推算而已。连好坏都没有确切的评判标准,当今围棋的具体下法显然也就缺乏最基本的逻辑验证了。

所幸的是,今天的职业棋手已经不再是往日那些一副宗师气派却藏拙如藏私的模样了。更激烈的竞争、更公开的信息通道加上更精确的局部计算,使越来越多以往不可想象的新变化鳞次展现在人们的面前。闻名遐迩的科学大牛曾说道,人类的知识是个可以不断变大的圆,圆内代表着已知,圆外代表着未知;随着已知知识的不断增多,我们接触到的新的未知的知识也会越来越多。今天的职业棋手常把“可能”“也许”“差不多”“搞不清”挂在嘴边的绝不妄下结论的谨慎的态度,不正是说明围棋人所掌握的知识已经远非昨日可比了吗?

最后,笔者大胆设想围棋今后发展的终极形态。在笔者的想象中,有一双滑板鞋啊不有一副蓝图,那里的棋手已经发明了一种相较于今天的“实地—外势评价体系”而言更加科学和准确的动态评分体系,每一颗棋盘上的棋子都有明确的算法得出具体的分数,而随着棋盘上任意一点的落子,每颗棋子的得分会有相应的精准的得分变化。在那里的世界中,棋手不再需要通过模糊的厚薄、发展等概念来衡量各着棋的大小,一个共有的科学的标准解决了一切烦恼。在那里的世界中,人工智能终于可以完美再现人的各种认知过程,棋手再也不需要自己动脑筋去精算每手棋的大小,一台高科技电脑回答了一切问题。那样的世界是如此完美,可是那样的围棋还有什么乐趣可言呢?今天的围棋这么难,还有这么多连电脑和人脑都无法解决的困难,不正是围棋吸引智者不断思考的魅力所在吗?

可是,隔岸观火和身临其境终究是不一样的。如果您也对本文探讨的领域有哪怕一丁点兴趣的话,请也来加入我们,尝试一下这个可能是整个人类历史中最困难也最有趣的游戏吧。一副棋具,两条规则,还您一生乐趣。
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表