返回列表 发帖

何云波 | 刘知青:围棋与人工智能(下)

作者:棋禅一味微信号  2019-03-19


本文转载自微信公众号:棋禅一味,作者何云波

人物档案:刘知青,男,生于1966年。1989年毕业于清华大学计算机系,1994年12月毕业于美国纽约大学计算机科学系,获博士学位。现任北京邮电大学教授,北邮九鼎计算机围棋研究所所长,主要研究方向:函数化程序语言、操作系统。同时致力于围棋人工智能研究。其研制的计算机围棋程序多次获全国计算机围棋大赛的冠军。著有《计算机围棋基础》《对面千里》等。

前一部分链接:刘知青:围棋与人工智能(上)

三、AlphaGo的创新


何:那后来AlphaGo是怎么解决这个问题的?
刘:当你使用手工把你的知识表现在你的程序里以后,你所做的工作都是有局限性的,所以应用性就差很多了。那么AlphaGo的方法,这些东西都没有,它的知识是通过数据自己学出来的,也就是说你不用告诉它,什么情况下该走什么棋,它通过看人家的棋谱就能学会。可能它偶尔也会填一下眼,但是概率非常非常低。因为人只有在特定情况下才会这么做,但正常情况下都不会这么做。它就会把人的这种概率都学出来。它完全就是依靠了人下棋的棋谱来学该怎么落子的。当你做随机的模拟的时候,它也是按照这个东西来做的。比如说,你小飞,它高挂,你托了以后它扳你退,它可以虎也可以粘上面,人会这样的,它也会。所以它的随机性反映的完全是人类的随机性。比如说人不会做特别怪的事情,比如长一个,但人几乎不会这么想,如果这样下的话也是非常低的概率,那么这个概率不管是0还是多少,也会反映在AlphaGo学习的过程中。它下棋的围棋知识不是人手工的代码告诉它的,它完全是通过数据学习的。

何:除了这个方法以外,AlphaGo还运用了一些什么方法?
刘:我觉得它的核心突破就是这个东西,它叫做深度学习神经网络。首先神经网络是模拟了人脑皮层的组织结构,当然它叫Artificial神经网络,就是说人工神经网络,不是真正的脑细胞的,是用计算机模拟的。过去的话这个网络只有两层三层,现在就可以很多了,比如AlphaGo怎么落子的这个选择,它是用了十三层,相对于以前是深了,那么是不是将来还会更深,也有可能。另外它完全是以图像的形式来处理的,它看棋谱的时候,它并不抽象出来,完全是以一个19X19的图像,每个图像上有三种颜色,黑的白的棋盘的。

何:做一个19X19的图像的话,图像里面它还继续分块吗?
刘:它不分块了,什么都不分。主要的网络有两个,一个叫做策略网络,就是说给你一个棋盘,它会告诉你在不同的位置落子的概率分布,每个点它都有个概率。策略网络其实就是给你一个盘面,你可以给出一系列的应对策略。另外一个是价值网络,就是说给你一个盘面,价值网络告诉你胜负的可能,比如说0代表白胜,1代表黑胜,0.5代表双方胜的可能性一样大。它自己跟自己下了三千万盘棋,每盘棋都有一个棋谱,也有最后胜负的结果。然后抽出一个棋谱来,这一盘还没结束,但是它已经知道最后的胜负了。这第二个价值网络,判断胜负的东西,是它的独创。前面的方法大家已经都在用了,深度学习神经网络之前Facebook用了一点点。去年在北京比赛的时候,有一个法国的教授他写了一个东西完全是按神经网络来做的,当然成绩不是特别好。

何:也就是说AlphaGo最核心的创新就是价值网络。
刘:对。而且后来哈萨比斯在他的评论中也说价值网络是他最核心的突破,它的强大也是依赖于价值网络。

何:那之前说的它输的那盘棋存在的弱点,主要是什么原因?
刘:我觉得还是它的价值网络还没有完全做好,也就是说它看不到白棋挖了一下,也就没看到这会导致黑棋不好的情况,也就是说他的价值网络对于这个选点不敏感。当时是存在这个弱点的,据说最近已经解决这个问题了。

何:这个问题解决了,从价值网络这个角度来说,它就越来越没漏洞了吗?
刘:是的。他们应该是还在一个逐渐强大的过程中,强大的原因就是要逐渐地增强价值网络的正确性。价值网络特别重要,因为它能看到这个地方不好,就赶紧停在这个地方了,也就是说这样的棋就不会下了。

何:最近日本也出了一个,叫Zen。它现在好像说变得比较强大了,是什么原因?
刘知青:Zen也是借鉴了神经网络。在AlphaGo之前,他们已经宣布找到了商家共同要做Deep Zen Go,我估计现在看到他们强大也是因为他们把深度学习的一些阶段性结果放到里面来了,可能还没有达到AlphaGo的水平,但是在逐渐地接近这个目标。

何:那你觉得整个的人工智能的发展会给围棋带来什么样的影响?
刘:我看到的是比较积极的影响,但是不同的人看的不太一样。我看它还是增加了围棋的魅力,首先关于它的报道很多,人机大战的时候谷歌的统计是2亿8千万人看了这个比赛,他们说第一场比赛在中国就有六千万的观众。2亿8千万人说明这是一个非常大的事件了,比美国美式橄榄球的总决赛的观众人还多。谷歌统计有3万5千份独立的媒体报道,还不包含转发的东西。围棋棋盘的销售量在国际上涨了十倍,当时一个月在某些地方买不到围棋棋盘了。很多人认为这个影响不亚于当年聂卫平擂台赛战胜日本人的影响。第二,围棋规则简单,但是变化无穷。那么AlphaGo的表现更证明它的变化的无穷了,过去人们觉得不可想的事情,现在变得可想了。它开阔了我们对围棋的见解和认识,有更多可探索的空间在里面。原来认为三路的是控制地的,四路是控制外面的,很少会有人在五路上面去下子。它这个都已经下在四路上面了,在五路尖冲。当时直接解说的时候,有个英国人在英语频道上解说的时候,他的第一感觉是这个棋是棋手摆错了,后来他才确认这是AlphaGo的下法,很明显是一个很令人吃惊的下法。哈萨比斯也在他的报告上面说,AlphaGo下了这步棋以后,李世石去卫生间待了15分钟,也是让李世石感到很吃惊的一手棋。所以这个就开阔了我们对围棋的认识,原来我们认为围棋只能这么下,但现在我们发现我们还可以那么下,就是说可能更多了。我觉得在这个意义上是增加了围棋的魅力。

何:这个事当时让很多人,特别是职业棋手接受不了。都说围棋是人类智慧最后一个不可被攻破的堡垒,职业棋手头上也就有了这么一个神圣的光环,他们可能不能接受这个光环一下子就被人工智能打破了。
刘:是,对于围棋的神秘性是有很大的冲击的。原来它是一种非常特殊的挑战,现在看上去可能还有比它更大的挑战。比如说,我们对于病理、生命的理解,我觉得这肯定是比围棋更难解决的一些问题。围棋毕竟还是一个有限空间,规则非常明确的一个游戏。那么现实生活中的问题还存在更多的未知变量,你很难去抽象出来,抽象成一个边界很确定的问题。当你的边界很确定、目标很明确的时候,我们现在看来计算机解决都是很容易的。那么对于一个开放的问题,边界是模糊的,你怎么做取舍。但是,人还是比较聪明的,我觉得还是不能给围棋太多的承担,把它说成是人类智慧最终的目标,就有点过了。

四、围棋人工智能能给我们带来什么


何:人工智能用于围棋之外的其他领域,哪些方面是最有可能的?
刘:DeepMind其实也说了他们要把它运用到与人类更密切相关的、能改变人的生活的一些重要领域里来,而且也说了医学是他们很重要的一个运用领域。最近还有北京的大夫,他们在联系我,希望用类似的方法去做医学上的一些东西。其实我可以解释一下一个问题,也是DeepMind他们做的,他们就在做病的早期诊断,有些病不太容易早期诊断的。他们举的一个例子叫做急性肾损伤,第一这个病如果不及时的话是致命的。所有住院病人20%是有这样一个病的,如果是重病房里的病人,可能50%。第一很普遍,第二很致命,第三诊断起来很困难。怎么诊断呢?一般是看尿量和化学元素的处理,你要那个东西处理不好,尿也就少了,最后证明是有肾损伤的。但是即使是两个肾都坏掉了,检验出这个东西来可能需要24小时以后,所以是比较滞后的一个检查。所以这个东西已经用到了医学上的检查。神经网络本身是个中性的技术,是一个与利益无关的技术,只要有相关的数据,都是可以做的。未来可以看到它可以做医疗诊断,可以做智能助手,比如说每个人都有不同的生活习惯,当你对他的生活方式有了足够多的了解,你可以比较准确地预测他用的词是什么样的、去买什么东西等等。你可能做一个很小的动作,它就知道你要往哪走了。

何:我们在编撰《围棋学》,有一部分就是围棋形态论,我就把棋分成了棋局(或者作品)、棋手、观众(或者读者),其实这个棋局本身有一套语言的系统,一个棋子就相当于一个字,两个字组成一个词,那两个棋子的组合,也可以是小飞、大飞,或者立、跳,这个词就有了意义,词汇和词汇组合之后就构成了一个棋形,就相当于成了一个句子,最后一盘棋下完就相当于一篇文章完成了,所以围棋是存在一套语言系统的。我们现在语言学研究已经非常成熟了,它从组词到造句到段落篇章的联系都研究很透彻了。但我们现在对围棋的研究,始终还停留在一个直观判断的基础上,永远只把飞、跳当作一种术语,很少有人去描述清楚每一个词的功能。那么有没有可能用一套系统,把围棋里面核心的东西去做一个描述?
刘:我可以理解你的想法,有积极的一面也有消极的一面。从积极一面来看,我也同意围棋具有语言学的特征,我们在2008年的时候就写过一个文章,在国际学术刊物上发表了,语言有一个好玩的地方,就是词汇使用的频率和它的顺序符合一个定理,叫做Zipf’s law,是以50年代哈佛大学的一个教授名字命名的。他是以英语为样本来观察的,在一个文本里面,你统计每个词使用的频率,然后按照频率去排个序,然后就会有一个下降,这个下降是一个指数型的下降。同时还要满足这么一个东西,前面20%的高频率的这些词,最后它们使用的总的次数占了总体的80%,那么后面80%的低频率的这些词,加起来只占了总体的20%。语言都符合这么一个分布关系。那么我们就按照类似的做了一个围棋中的分词的研究。怎么看分词呢?比如你落了一个点,看这个点跟周围棋子之间的关系,周围的范围也可以定的稍微大一点也可以稍微小一点,以这样的东西来做统计的时候,就按照出现的概率,按照概率排一个序,它也是这样的一个趋向,就是说某些形状非常容易出现,到了后面有很多很多形状偶尔出现一次。这是通过职业选手上万个棋谱来做的统计分析,它也完全满足语言学上的Zipf’s law。这是我们2008年观察到的一个结果。

何:可不可以理解为,一个句子就相当于一个定式或者一个局部的棋形?
刘:对,就看你怎么去定义这个句子在哪结束,当然这是形式上的问题,不考虑它的意义,但句子背后还有表达的思想。这个东西跟语言学是有关系的,我们前期做的只是第一步,就是在词汇上面能够看到词汇的语言特征的。后面的词组、段落、整体章节、语意都还没有做。

何:下棋是两个人在对话,两个人对话始终在限制与反限制之间。当然,语言学也可以理解为两个人处在辩论的状态,辩论的状态是我永远在批驳你。所以,我不知道有没有可能把围棋做出这种语言学的描述。如果做这种描述,那计算机围棋给这种描述能带来什么样的帮助?
刘:我的态度是积极的,我觉得这个事是可以做的,但是这个事情挺复杂的。它有一些最基本的工具,比如刚才我们做的一个统计上的分析,是计算机可以做的。我前期是做程序语言这种工作的,程序语言有词法、语法、语意之类的一系列的工作,那么自然语言也有词法、语法、语意这些东西,我觉得可以参照这些东西,就是通过语义学来做,语义学有两个派别,一种是语法派,另外一种学派就是统计学派,统计学派并不在乎语法是什么样的情况,它更注重的是人的使用是什么样的习惯,我觉得围棋更适合于用统计学来分析。但是,具体地做下去可能还是一个挺复杂的事情。

何:计算机做出描述之后,是不是要转化为人类语言之后才能理解计算机的那种思维?
刘:可能还是比较困难,它可以给你展现一棵树,它也可以预测一个将来可能的一个路径,就是说我下了这个子了,这是我认为下得最好的。对方会根据它的最优选择来下,甚至可以预测到未来的十步二十步。但是它目前还缺乏自然语言的表述方式。

何:也就是说,我们要解读AlphaGo的每一个棋谱,要把它的程序语言转化为自然语言,现在还是有很大的难处的,没办法去描述。
刘:对。机器本身没有办法描述出来,人也没有办法,人只可以看出来它有胜率的描述。它会把变化以非常具体的围棋的方式来告诉你,但是它无法明确用人类的语言去描述。比如说五路尖冲,我们可以理解是它不仅压制了这边,它还呼应了左下角的两个残子。

何:也就是说,我们只能去揣测它的意图,但它本质的意图现在是没法知道的,计算机怎么想的我们没法知道。
刘:它不是用语言来思考的,所以它无法用语言来表达它的情感,它只是用胜率的方法来表达的。它可以说谁的胜率高,甚至可以说我那两个残子活的机会比较大,这些都是我们可以看到的。但是,人要主动地去做这些联系,计算机是用数字思考的,但是这些数字有些对我们来说,意义就不是特别好理解。

何:但是事实上,我们解读棋局,就像解读古人的一个棋谱,我们照样也只能去揣测古人下这步棋的意图是什么,为什么会做出这种选择。古人是怎么想的,我们永远也没办法知道。古人也不可能每一局棋谱都有自战解说,但这种自战解说也是有限的。在没有自战解说的情况下,我们面对着这么一个棋谱,跟面对AlphaGo下出来的棋,其实是同一个状态。
刘:本质上是一致的。但它有一个微小的差别,我们一般认为我们要比古人强大一点,因为我们比他们强,我们就能更好地去理解他们表述的方式,也能看出他的弱点来。如果AlphaGo比我们每个人都强大的时候,我们再试图解释一个比我们更强大的东西的时候,我们可能存在着理解上的不充分的情况。

何:事实上我们要去做一个棋谱的解读时,也有可能按照这种方式去揣测,至少按照我们的方式去做一种描述,还是可能的。这种描述有没有可能达到一种理想的状态,就是能够把这个过程给描述出来。
刘:我觉得是有可能的。现在我们可以看出来一点点,就是AlphaGo本身可能更重视外面,原来我们认为三线、四线就很平衡了。最后一盘李世石尖冲三路的时候,它镇在外面了。这些东西都表示了它一定的偏好了,还是可以总结出来的。

何:用语言学角度对围棋语言的解读,或者对围棋知识系统的一种描述,完全有可能把它做成一个研究课题。有人把围棋讲得玄妙得不得了,我有些不以为然,一说围棋就很玄妙,好像只有宇宙人才能发明的东西。
刘:是的,这就需要我们做科学研究的跟做文化研究的学者共同密切合作、共同努力了。

访谈手记:很早就听说北京邮电大学成立了九鼎计算机围棋研究所,由刘知青教授领衔。有一次与中南大学的武坤教授出游途经北京,武坤教授也是在北邮读的本科,与他一起去北邮拜访大力支持围棋的林金桐校长和刘知青教授,并与刘教授手谈一局。那时国内的计算机围棋还起步不久,战胜人类似乎还遥遥无期。没想到,AlphaGo突然横空出世,胜了人类顶尖高手李世石,一下子带动围棋人工智能包括围棋本身的热潮。2016年7月19-25日全国应氏杯大学生围棋赛在汕头举行。除了常规的比赛,还有许多围棋文化的活动,其中就包括我主持的围棋文化论坛和请刘知青教授作一场围棋人工智能的讲座。访谈就利用其中的一个间隙进行。那天上午游玩,刘教授是晚上的飞机。下午就着一杯清茶,聊围棋与人工智能的话题,兴味盎然。人生里面有些瞬间,尽管平常,却让人难忘。此即一也。

附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表