返回列表 发帖

【AI】围棋AI给出的手段,难道就是正解吗?

找借口安静 2023-04-02 23:52 发表于上海

原址:https://www.nihonkiin.or.jp/etc/go_weekly/tsururin083.html
原题:AIの手は正解なのか~大橋拓文七段と考えるAIとの付き合い方「つるりん式観る碁のすすめ~こぼれ話」
摘自:日本棋院
作者:编辑K
翻译和整理:找借口安静 这篇比较长就翻了


这一次我们请了学术类钢琴家(?),被誉为是太空人的大桥拓文七段。大桥拓文的钢琴水平应该是棋界第一人。然后对围棋AI方面有着非常广泛的知识,经常下出一些AI手段的同时,还研究AI是不是有极限,AI认为的最强手段是怎么定义的,从科学和哲学领域对其进行研究。

当今AI已经成为了触手可及的工具,想到AI就想到能给我们准确的下法。将实力的基准提升到了和AI的吻合度。但是AI真的是正确的吗?难道提升和AI的吻合度才能是接近最好手段的方式吗?

在这个专栏中,我们直接把这些问题抛给大桥拓文,对AI的现状进行探究。AI实力强劲,并且能看到绝对的结论。而AI给我们显示的手段,是不是我们想到的神之一手呢?我们借此来了解一下深奥的AI世界的冰山一角。

——大桥拓文七段今天请多关照。

大桥拓文:请多关照。

——长话短说我们想针对AI进行采访,AlphaGo出现至今已有7年多,AI现在已经成为了我们触手可及的东西。现在棋手们用AI进行研究已经是常态,在直播中用AI胜率值进行表示,还用AI显示出当前局面的推荐手段。拿自己来说,我在看棋的时候也会下意识地把AI给出的手段当作是“正解”,实际上你觉得AI给出的手段就真的是“正解”吗?

大桥拓文:这个确实很复杂,首先我们要对“正解”进行定义。多数情况下,下出比人类更加精准,并且能赢棋的手段,我觉得比较接近于“正解”的。

——也就是说这不是“正解”,应该是属于“最佳”。那你觉得AI给出的手段是“最佳”手段吗?

大桥拓文:我们先不谈人类怎么接受这些下法,首先AI是没有“最佳”的概念的。在这种情况下来评判“最佳”,是不是觉得是一件很困难的事情呢?比如说用最短的手数赢棋,还是赢最多的目数,你觉得哪一个才是“最佳”呢?

——这么说还挺有道理的,这两个角度其实都可以认为是“最佳”。

大桥拓文:刚刚我也提到了AI没有“最佳”的概念,但是AI在选择每一手棋的之后,都有着
“获胜”的目标。然后如何设定“获胜”的方式,就取决于各个AI的个性了。实际上这都是由设计程序的人类设计而反映出的结果。

——这是什么原因呢?

大桥拓文:比如说,AlphaGo把最终的目标定在“赢棋”,然后选择避开高风险的手段,选择了赢半目的下法。所以就会选择一些人类看上去可能会亏损的手段,但是AI依旧会选择安全的下法。后来就出现了从“以更大的目数获胜”的AI。这就和“哥伦布的鸡蛋”一样,因为追求更大的目数的AI比追求仅仅“赢”的AI更强大,但并不一定需要刻意去制作一个追求更大目数的AI。总之相较于AlphaGo时代的AI,现在的AI越来越倾向于选择高风险高回报。

——棋风和人类一样很有意思。

大桥拓文:进一步来说,现在还出现了在布局阶段,通过对手的手段来推测实力。一旦判断“棋力较低”之后AI就会选择比较收手的手段的AI。当然这也是因为当初程序是这么设计的,所以看上去才会那样,实际上被下套的人就觉得自己就和漫画《棋魂》中的棋会所的那个大叔一样,感觉任何下法都被他看透了。

——确实有这种感觉,就觉得AI是富有人格的。

大桥拓文:我也有这种感觉,但是后来冷静地告诉自己,这些都是通过计算得到的结果(笑)。

——我们换一个话题,有的棋手说:“因为AI自己手段的范围变广了”,也有说“自己的手段变窄了”。而你又是怎么感觉的呢?

大桥拓文:从长远角度出发是变广了,但是目前处在过渡期,确实有些人会觉得范围变窄了。

——这是什么原因呢?

大桥拓文:AI会通过自我对局来提升自己的水平。比如我你和相同棋力、相同棋风的人一直下几千或者几万盘,你觉得会不会涨棋呢?

——难道不会变强吗?

大桥拓文:你觉得你和棋风一样的人一直下棋,实力会变强吗?

——我明白了。确实如果和棋风相同的人一直对局,那只会反复下一样的布局。到后来只擅长某一个布局,但是其他手段的话可能并非如此了。

大桥拓文:就是这个道理。通过电脑进行自我对局,重复进行几万盘相同的事情。说实话我们也不知道他是不是聪明(笑)。不过像AlphaGo Zero那样开发这一类AI的话,让电脑自我进行自我对局的操作也非常重要。不过开发下围棋很强的AI的话,现阶段还是需要通过人类的设置,才能扩大研究的范围。这些其实从KataGo的官方网站就能有所了解。实际上现在的围棋AI的布局套路也变得越来越多。

——我看AI经常点三三,这或许可能不是因为这是好棋才这么下,而是因为这手棋经常出现,所以AI也这么下了。如果AI今后变得更强的话,今后的AI定式有可能会和现在完全不一样,布局也有可能变得多样化。

大桥拓文:就是这个道理,还有就是和现在相关的话题,那就是我想强调AI“不会像人类一样有认知,也不会有理解能力”。你应该还记得,AlphaGo刚出现的时候,很不擅长征子和大头鬼。

——是的,明明这么强,竟然不认识征子。

大桥拓文:现在的AI通过人类的设置,把AI不擅长的棋型程序化了,所以现在他们也知道什么是征子了,有的人可能会觉得,这么简单的事情还需要通过设置来解决挺不可思议的。为什么会出现这种情况呢?那就是AI不知道征子,也不会理解什么是征子。其实不仅是征子,其实连两眼做活,AI也都是一知半解的。

——详细说说。

大桥拓文:人类会通过伦理来考虑手段,通过棋型来识别征子的棋型。这样理所当然的事情其实AI是做不到的。与其说做不到,AI在这方面的思维方式就不一样。围棋AI会把自己摸索的范围作为自己的世界,但是自己摸索不到的地方它们是不知道的。简单来说的话,比如说有一个手数很长的征子,人类的话只要知道征子的棋型,哪怕是100手的征子也是可以下完并且吃掉的。但是AI就没有“重复做这个动作”的想法,每一手棋都需要摸索,所以在计算100手的征子时,他们计算到50手就有可能算不下去了。

前段时间出现了只要找到AI的弱点,人类就能战胜围棋AI的事情成为了话题。实际上AI连死活的改变也没有。为了让AI产生错觉,让AI把自己的棋走成一个环,这样的话AI就会觉得即便只有一只眼也能活棋。以前AI就有只要不会被拔起来的棋,AI就有可能将其认为是活棋的错觉。但是只要让AI的棋围成一圈,AI就完全被我们套路的事情。在这方面相较于棋手,很多职业游戏玩家比我们更厉害(笑)。并且人类只要有10级左右的棋力,就能轻轻松松识破这个弱点。人类至少知道两眼活棋或者双活的概念,但是对AI来说,我觉得他们对两眼活棋的概念应该还是一知半解的。

——能轻轻松松战胜顶尖棋手的围棋AI,竟然没有“认知”和“理解”的概念还是很意外的。

大桥拓文:真的是这样,问题是从AI获得手段的人类,可能一直会觉得这是AI的认知或者是理解。对AI来说,他们学习的世界可能会比人类做得更好,但是在他们没有学习到的世界,很多人类可以轻轻松松做到的事情,AI有时候可能就做不到。所以我们要理解AI的基础上,如何和AI共同相处才是非常重要的。

——不把AI一切当成绝对的结果是很重要的事情。最后还想问的一个问题是,我们今后如何和AI共同相处下去呢?

大桥拓文:我们每天都和各种AI进行对局,现在围棋AI的实力面对人类棋手是碾压式的强大。我的话至少要受让30目才行。在扑朔迷离的局面下,AI的形势判断也很准确,包括需要计算的中盘对攻,虽然在这种情况下可能比形势判断要稍微逊色一些,不过很多时候还是比人类棋手要强。利用AI进行学习是非常有用的事情,还有可能会扩大围棋的可能性。不过很多时候觉得AI给出的手段很容易被认为是正解,其实很多手段有可能是错误的,即便是正确的,我们可能也很难下出最好的下法。也就是说AI给出的手段对我们来说是不是好棋,这是我们需要判断也是需要我们好好学习的地方。

——现在的AI技术,在围棋以外的领域正逐步开始变得实用化。这一次提到的和围棋AI的相处方式,今后在身边可能会有更多的AI出现,在这种情况下我们该如何相处,这一次确实是学到了很多东西。今天非常感谢接受采访。
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表