【对话】AI的阿喀琉斯之踵——当今围棋界和AI的共处方式（5）

找借口安静 2021-05-17

原址：https://bunshun.jp/articles/-/43711
原题：いま囲碁界で起きている“人間とAI”の関係──「中国企業2強時代」「AIに2000連敗して人類最強へと成長」将棋界とは異なるAIとの向き合いかた
摘自：文春Online
图片：ITMedia
记者：白鸟士郎
嘉宾：大桥拓文六段
翻译和整理：找借口安静我又把这个连载忘了

白鸟士郎：我们能下载简易版的软件吗？

大桥拓文：不能，不过我们可以把在那个平台上下的棋，用绝艺进行复盘。

白鸟士郎：哦哦哦！

大桥拓文：平时用用还是挺方便的，不过只用1秒钟就会把结果从中国那边传过来。

白鸟士郎：这么说算路并不深啊，这样的话职业棋手是不是就不够用了？

大桥拓文：是的，不过职业棋手从中获得提示，然后用自己高性能的电脑进行验证。当然了，他们用的就不是绝艺那样的AI了。

白鸟士郎：绝艺下的棋，是不是很独特呢？

大桥拓文：并非如此，在布局上面，人类和AI感觉还是非常相似的。不过总的来说是人类棋手接近了AI，但是中盘之后AI就实在是太强了，很多地方就不是我们可以理解的了。

白鸟士郎：这和将棋界还是很相似的，不过用了深度学习技术的将棋AI，在终盘阶段的计算上面有一些困难。

大桥拓文：确实如此，深度学习技术用的很多都是人类的棋感，布局虽然很强，但是在围棋当中最重要的后半盘就稍微有些薄弱了。但是刚刚提到的星阵，用了很多技术，所以中盘之后的实力比其他AI要强。

白鸟士郎：虽说是深度学习，但是中后盘很强，这样岂不是无敌了？

大桥拓文：虽说都是深度学习，但是也有很多种类，星阵就是克服了这个问题，所以就达到了很难让其他AI匹敌的高度。

相较于AlphaGo Zero完全就是通过自我学习，将人类的领域知识组合起来让AI学习的话，或许作为围棋AI来说更强一些。

白鸟士郎：很抱歉，领域知识是什么？

大桥拓文：这个该怎么说呢，虽然不是规则，但是人类在下棋的时候需要考虑的地方。还有就是还有多少手棋就能吃掉这些棋，具体来说就是征子。

白鸟士郎：就是越下越到边上，然后最后全部被吃的棋型吗？

大桥拓文：Zero系的AI，其实是很不擅长征子的。还有就是两眼活棋吧，这也是AlphaGo Zero没有学过的东西。

白鸟士郎：在地盘上做出两只眼的话，就不会被吃掉了，这应该是围棋的基础中的基础吧。

大桥拓文：所以这些东西都是通过自我学习，这就是Zero系的AI。然后Zero系也需要花费很多学习资源，所以说这些我们还是先给他们准备一下的。

白鸟士郎：不过从开发的角度出发，感觉有一些向后退的样子。毕竟在没有用任何人类知识的情况下，变得这么强的。

大桥拓文：我觉得不是那样。刚开始AlphaGo出来的时候，人类还非常绝望地觉得：“人类之前建立起来的所有东西都白费了啊”。但是AlphaGo Zero的厉害之处，就是延伸出了Alpha Star、Alpha Ford等大众化的东西。

既然能让专业的围棋AI提升实力，那么让深度学习技术更有效率，通过人类辅助的AI，才能发展到目前的高度。

白鸟士郎：原来如此。

大桥拓文：还有一个敏感的问题就是，我觉得“深度学习的AI中后盘比较弱”的原因，归咎于“提供的数据本来就是不怎么会下中后盘的，所以中后盘就变差了”。

白鸟士郎：确实有道理。中后盘不太行的深度学习AI，让他们进行自我学习的话，中后盘也就必然变差了。如果根据原来的数据学习的话，再怎么下下去也都是差劲的。

大桥拓文：星阵和Katago，刚开始都是教他们该领域的知识之后，开始进行自我学习。而他们的中后盘，正是从实力强劲的数据中渐渐变强得来的。所以这应该就是他们强大的原因了。

而AlphaGo Zero用了实力突破了瓶颈。用了40b的大量TPU。

白鸟士郎：（又出现了我不会的术语），这个b是，数量越大就越厉害吗？

大桥拓文：是的，这个是模拟了人类大脑的神经网络的大小。块数越多，就越聪明。所以就觉得数字越大就越强，但是星阵的开发者好像并不认同这个观点（笑）。

附件: 您需要登录才可以下载或查看附件。没有帐号？注册

返回列表

【对话】AI的阿喀琉斯之踵——当今围棋界和AI的共处方式（5）

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]