返回列表 发帖

【AI】“知道对手是用什么AI研究的”,“AI品酒师”关航太郎的实力

找借口安静 2022-05-07 20:37

原址:https://jbpress.ismedia.jp/articles/-/69599
原题:「相手がどのAIで研究したか分かる」囲碁界の新星“AIソムリエ”関航太郎
摘自:JBpress
作者:内藤由起子
翻译和整理:找借口安静 马上本因坊战


让围棋界震惊的年轻头衔持有者

2021年围棋界迎来大冲击。被认为是井山裕太接班人的一力辽天元(当时),不敌成为职业棋手不到5年的四段棋手并丢掉了头衔。

这位年轻人的名字是关航太郎。刚过20岁生日没有几天,就以史上第二年轻的纪录夺得了“天元”头衔,这件事让日本围棋界非常震惊。当然了,关航太郎是获得过新人王冠军的棋手,但是成为顶尖棋手可能还需要一段时间。

关航太郎究竟为什么能成长的这么快。我们问了关航太郎的学棋方法时候,知道了他惊人的学棋方式。这也是后来很多棋手后来称他为“AI品酒师”的原因。


抓住人类盲点的围棋AI

2016年,这一年首个可以击败人类棋手的围棋AI诞生了。谷歌DeepMind开发的“AlphaGo”击败了李世石九段和柯洁九段,让世界震惊。之前很多棋类项目的AI,都是摸索所有有可能的手段,然后找出最容易可以赢棋的“用蛮力查找”的方式。但是围棋比其他游戏选择项更多,当时的AI很难击败人类棋手。

这个时候AlphaGo的深度学习技术,通过评价系数开发后,人工智能技术得到飞跃般的上升,解决了之前遇到了困难。原本认为AlphaGo会用大量的硬件以及电力,不过通过TPU之后就变得更加便捷和省电。

在此之后,“绝艺”、“星阵”、“KataGo”等电脑围棋AI软件陆陆续续出现后,每个人都能通过电脑利用围棋AI。现在的AI并非用来平等胜负的对手,而是通过研究工具,成为了身边的伙伴。

AI会对每一手棋用胜率进行评价,在当前的局面下显示胜率,然后后面一手棋的胜率增减就能判断手段的好坏。AI会对下一个最佳手段的地方会用蓝光显示,日本棋手会把好棋称作“蓝点”,胜率下降之后就会说:“被AI批评了”。AI现在把之前人类认为是好手的地方评价是好手,也有可能反而把人类觉得是好手的棋评价为坏棋。AI的想法看到了人类的盲点,也对人类让围棋的想法有了巨大的转变。


可以“品尝”AI的能力

那么,AI和顶尖棋手的差距有多少呢?

对围棋AI有研究的大桥拓文七段表示,现在职业棋手需要受让AI:“让2子的话,AI能有9成胜率。即便是世界最强的申真谞九段受让2子,对AI也是只能偶尔赢棋。如果3子能获胜的话就可以证明是职业棋手了。4子的话职业棋手就可以赢棋”。这正是现在的差距。

刚刚提到的关航太郎在2007年,15岁那年成为了职业棋手。这个时候“没有使用任何人类棋谱,只教了围棋规则,然后通过自我对战后提升实力的”AlphaGo Zero刚刚出现。当时就对AI很感兴趣的关航太郎就参加了大桥拓文主办的“AI研”。在这个研究会里,一直都在研究如何用AI学习围棋。

关航太郎随着AI的进步,AI的研究也更加深入。大桥拓文说:“关航太郎早就知道‘这手棋我知道AI的评价是多少’,然后他说出来的数据基本都能答对。然后看对手的手段就知道对方用了什么AI进行研究,因为关航太郎能‘品尝’出AI的手段,所以我就说了一句‘很像品酒师啊’之后,这个词就传开了”。

浏览“AI左右互搏”的独特学棋方式

关航太郎知道AI的胜率,可以达到‘品尝’AI的能力,源自于他比较异类的研究AI的方式。很多棋手都会把自己下过的棋用AI进行研究,然后看到哪手棋比较差,这手棋该怎么下比较好。也就是说用来回顾一盘棋,作为一个反思的资料进行研究。

这和以前把棋给老师或者前辈看之后,让他们批评指出意见,只不过老师和前辈现在都变成了AI。这是为了能提升实力而必须要做的事情。

不过关航太郎是看着AI的左右互搏,一直欣赏AI的棋局是他独特的研究方式。就让AI自己和自己下几盘棋,然后关航太郎就一直看AI下棋。这个时候关航太郎也不再参加研究会,一直就在家里研究。这样可以说是另类的AI研究方式,大桥拓文表示:“AI会下出可以作为示范的手段,而关航太郎看着AI下棋是很有道理的研究方法”,虽然如此评价,但是为什么这个研究方式为什么没有流行开来呢?

人类的手段,只要下出来就能或多或少看到这手棋的作战和故事,但是AI下出来的手段经常都是主旨不明确的下法,也看不到这手棋的故事性。

再加上AI的棋相较于人类的棋,有趣程度也会有所降低,这也是从AI学棋的一大难度。理解AI的手段成为自己的东西是需要相当强的实力,而关航太郎从AI学到各种东西后成功突围。


关航太郎改变了自己的AI的研究手段

在夺得头衔后4个多月,最近关航太郎的研究手段改变了其他棋手都在执行的“用AI进行复盘”的方法。这是为什么呢?

在夺得头衔之后,增加了和世界顶尖棋手对局的机会,关航太郎说:“明显感觉存在差距”。为了想要改变自己,于是对研究方法也进行了各种尝试。“以前用AI学棋的时间很多,现在有点返璞归真的感觉。现在就是不利用AI,通过之前的学习方式学棋。今后如果想要借助AI的力量的话,再考虑用AI研究”。每个AI都有各自的个性,候选手段也会有所不同。虽然现在这些候选手段已经不再乱七八糟,不过大桥拓文表示:“即便如此还有很多未知的手段还没浮现出来”。还补充说,“现在的AI依旧在不断变强,如果人类棋手跟着AI步伐的话也会变强”。

最近AI不仅用来复盘,作为明天对局的准备工具的棋手也大有人在。可以通过过去的棋局来预测未来的手段。在这里面最好的例子就是今年2月25日进行的农心杯。一力辽说:“前50手和AI研究的手段一样进行”,其结果就是在布局阶段面对世界最强的申真谞九段还能保持五五开的局面。

申真谞在当时刷下了世界大赛27连胜的非凡纪录。擅长在进入中盘之间就处于领先优势,然后把优势保持到最后是他的风格。但是这盘棋面对一力辽,布局阶段一力辽紧咬申真谞,申真谞一度也比较棘手,后来一力辽出现判断失误等情况后,申真谞获胜。

围棋有4000多年的历史,在世界上也下过无数盘对局,没有一盘棋是完全吻合的。每一次都要面对一个全新的局面。最后还是需要棋手自己来思考局面并做出决定。围棋AI作为人工智能,我们人类还需要考虑如何使用,并把AI的思路成为自己的东西。这对人类来说,还是一段漫长的道路。
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表