返回列表 发帖

【对话】AI的阿喀琉斯之踵——当今围棋界和AI的共处方式(5)

找借口安静  2021-05-17

原址:https://bunshun.jp/articles/-/43711
原题:いま囲碁界で起きている“人間とAI”の関係──「中国企業2強時代」「AIに2000連敗して人類最強へと成長」将棋界とは異なるAIとの向き合いかた
摘自:文春Online
图片:ITMedia
记者:白鸟士郎
嘉宾:大桥拓文 六段
翻译和整理:找借口安静 我又把这个连载忘了


白鸟士郎:我们能下载简易版的软件吗?

大桥拓文:不能,不过我们可以把在那个平台上下的棋,用绝艺进行复盘。

白鸟士郎:哦哦哦!

大桥拓文:平时用用还是挺方便的,不过只用1秒钟就会把结果从中国那边传过来。

白鸟士郎:这么说算路并不深啊,这样的话职业棋手是不是就不够用了?

大桥拓文:是的,不过职业棋手从中获得提示,然后用自己高性能的电脑进行验证。当然了,他们用的就不是绝艺那样的AI了。

白鸟士郎:绝艺下的棋,是不是很独特呢?

大桥拓文:并非如此,在布局上面,人类和AI感觉还是非常相似的。不过总的来说是人类棋手接近了AI,但是中盘之后AI就实在是太强了,很多地方就不是我们可以理解的了。

白鸟士郎:这和将棋界还是很相似的,不过用了深度学习技术的将棋AI,在终盘阶段的计算上面有一些困难。

大桥拓文:确实如此,深度学习技术用的很多都是人类的棋感,布局虽然很强,但是在围棋当中最重要的后半盘就稍微有些薄弱了。但是刚刚提到的星阵,用了很多技术,所以中盘之后的实力比其他AI要强。

白鸟士郎:虽说是深度学习,但是中后盘很强,这样岂不是无敌了?

大桥拓文:虽说都是深度学习,但是也有很多种类,星阵就是克服了这个问题,所以就达到了很难让其他AI匹敌的高度。

相较于AlphaGo Zero完全就是通过自我学习,将人类的领域知识组合起来让AI学习的话,或许作为围棋AI来说更强一些。

白鸟士郎:很抱歉,领域知识是什么?

大桥拓文:这个该怎么说呢,虽然不是规则,但是人类在下棋的时候需要考虑的地方。还有就是还有多少手棋就能吃掉这些棋,具体来说就是征子。

白鸟士郎:就是越下越到边上,然后最后全部被吃的棋型吗?


大桥拓文:Zero系的AI,其实是很不擅长征子的。还有就是两眼活棋吧,这也是AlphaGo Zero没有学过的东西。

白鸟士郎:在地盘上做出两只眼的话,就不会被吃掉了,这应该是围棋的基础中的基础吧。

大桥拓文:所以这些东西都是通过自我学习,这就是Zero系的AI。然后Zero系也需要花费很多学习资源,所以说这些我们还是先给他们准备一下的。

白鸟士郎:不过从开发的角度出发,感觉有一些向后退的样子。毕竟在没有用任何人类知识的情况下,变得这么强的。

大桥拓文:我觉得不是那样。刚开始AlphaGo出来的时候,人类还非常绝望地觉得:“人类之前建立起来的所有东西都白费了啊”。但是AlphaGo Zero的厉害之处,就是延伸出了Alpha Star、Alpha Ford等大众化的东西。

既然能让专业的围棋AI提升实力,那么让深度学习技术更有效率,通过人类辅助的AI,才能发展到目前的高度。

白鸟士郎:原来如此。

大桥拓文:还有一个敏感的问题就是,我觉得“深度学习的AI中后盘比较弱”的原因,归咎于“提供的数据本来就是不怎么会下中后盘的,所以中后盘就变差了”。

白鸟士郎:确实有道理。中后盘不太行的深度学习AI,让他们进行自我学习的话,中后盘也就必然变差了。如果根据原来的数据学习的话,再怎么下下去也都是差劲的。

大桥拓文:星阵和Katago,刚开始都是教他们该领域的知识之后,开始进行自我学习。而他们的中后盘,正是从实力强劲的数据中渐渐变强得来的。所以这应该就是他们强大的原因了。

而AlphaGo Zero用了实力突破了瓶颈。用了40b的大量TPU。

白鸟士郎:(又出现了我不会的术语),这个b是,数量越大就越厉害吗?

大桥拓文:是的,这个是模拟了人类大脑的神经网络的大小。块数越多,就越聪明。所以就觉得数字越大就越强,但是星阵的开发者好像并不认同这个观点(笑)。
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表