【对话】百分比和目数——当今围棋界和AI的共处方式（7）

找借口安静 2021-06-07

原址：https://bunshun.jp/articles/-/43711
原题：いま囲碁界で起きている“人間とAI”の関係──「中国企業2強時代」「AIに2000連敗して人類最強へと成長」将棋界とは異なるAIとの向き合いかた
摘自：文春Online
图片：ITMedia、h-eba
记者：白鸟士郎
嘉宾：大桥拓文六段
翻译和整理：找借口安静这个专栏争取这个月结束

白鸟士郎：那么，围棋AI是用百分比表示形势的吗？将棋AI用的是点数。

大桥拓文：围棋的话就用比如“黑胜率55%”的方式表示形势。但是最近感觉这个数字也很有意思。在胜率下面显示目数的正是星阵，感觉这个搭配让星阵变得越来越强了。

白鸟士郎：两个数值放在一起吗？

大桥拓文：是的，因为围棋是看谁围的地盘多的游戏，所以之前的AI即便说黑棋胜率90%，也是不知道究竟是赢了50目还是1目。

如果胜率90%的情况下只领先1目，那么一个小小的失误就能被逆转。但是AI不怎么失误，所以就有90%的胜率，但是人类经常会出现失误，所以这个时候完全就谈不上是90%的胜率。然后星阵就会告诉我们，这里的黑90%是黑领先1目，告诉我们更贴近人类的胜率。

然后最近还出现了KataGo的围棋AI，这个AI也是免费开源的软件，有很多开发人员对其进行改造。就像将棋界的软件“Yaneura王”一样。

如果只说开源软件的话，到去年为止Leela Zero最有人气，但是现在感觉KataGo的人气更胜一筹，因为KataGo可以显示目数。

白鸟士郎：会帮你显示出，你领先多少目那样的数据吗？

大桥拓文：是的。最近大家流行用的是星阵和KataGo，但是开源软件的话，感觉KataGo更好一些。

白鸟士郎：如果能计算目数的话，也就是说深度学习里面最薄弱的终盘能力得到加强了吗？

大桥拓文：是的，本身深度学习最擅长的就是识别图像。围棋就像点画一样，深度学习可以从局面识别能否赢棋。但是需要计算目数，所以需要搜索更多的东西，当然刚开始就让AI学习这个技术，确实是很困难的事情，但是一旦走上正轨的话，渐渐觉得这样能让AI变得更强。

不过这也不能说完全刻画了人类的思路，现在我们的目标就是做出更加像人类的AI。

白鸟士郎：这么说，AlphaGo出现之后年轻棋手们看着胜率进行思考，现在他们就根据目数进行思考了吗？

大桥拓文：这是一个很复杂的地方，像KataGo和星阵，就把胜率和目数都显示在棋盘上，进行形势判断。

但是目数的表示很细微，第一选点和第二选点的差距有可能就只差0.1目。

白鸟士郎：原来不是差1目，而是小数点以下的差距啊。

大桥拓文：有时候第一选点和第十选点的差距就差1目，这也是常有的，

白鸟士郎：哇，这样的话确实不知道下在哪里好了。

大桥拓文：具体来说，我的话布局阶段就看胜率，然后到了终盘就看看目数。

布局阶段有时候第一选点和第七选点就差1目棋，我们吃透这些变化难度实在是太大了（笑）。

不过胜率的话就会差7%，比如说49%和56%，是不是差了很多？

白鸟士郎：电脑告诉我们胜率以及目数这样明确的数字，这样人类的学习效率是否提升了呢？

大桥拓文：还是有了目数之后，棋手们的学习效率就提高了很多。有时候AI显示胜率70%，但是赢10目的70%，和只差1目的70%，我们在这方面有很多不懂的地方。

但是有时候“这里就差1目怎么就70%呢？”，或者“我吃了这么多棋，怎么胜率就70%呢”之类的想法。

白鸟士郎：这样的话，那个胜率70%更好理解呢？

大桥拓文：这个要看情况，有时候即便能吃很多棋，然后你全部下对，把对手吃掉的话就能赢棋，但是有时候哪怕下错一手棋，胜率就会大幅下降。

白鸟士郎：原来如此，即便只差1目，有时候不用费尽周折，可以说安全运转就可以赢了，这一点和将棋很像。

大桥拓文：这就是“胜率的反乌托邦”（笑）。即便是将棋软件，把数字和百分比组合在一起的话，有可能也会变强的。

如果围棋的目数用将棋思路进行比较的话，比如说可以制造一个用最短的次序进行收束的AI。

白鸟士郎：原来如此。

大桥拓文：还有就是，Zero系列的深度学习软件，需要花很多的资金。所以希望开发将棋AI的各位能找到更有效率的方法，然后能运用在围棋领域的话就最好了（笑）。

白鸟士郎：资金就是，为了开发投入了多少钱吗？

大桥拓文：开发AlphaGo的DeepMind团队，为了开发就从谷歌借了服务器，然后花了3500万美元，看到这个新闻吓了一跳。

白鸟士郎：啊？一美金大概换算成110日元，大概是40亿日元？啊？为了开发深度学习，花了这么多钱吗？

大桥拓文：总之需要庞大的资源，用AlphaGo举例的话，TPU用了2000基，然后Facebook在开发ElF Open Go的时候，也用了2000基的GPU。我们在开发GLOBIS-AQZ的时候，也用了1000基。

白鸟士郎：1000！需要这么多吗？

大桥拓文：1000基，在日本也是基本上做不到的。

白鸟士郎：那么是要用海外的服务器进行开发的吗？

大桥拓文：不是，我们用的是产业技术综合研究所的大规模AI云计算程序“ABCI”。

白鸟士郎：产业技术综合研究所的ABCI，明白了。在2018年还是有着世界前五性能的大规模云计算系统。有4352基的高性能GPU，原来这样的系统在日本也有呀。

大桥拓文：在那边有4000基以上当时最好的GPU——V100，我们用了大约1年的样子。我们最多的时候用了1000基，真的很感谢他们。

但是GLOBIS-AQZ的开发现在也停下来了。现在不再以企业为单位进行大规模的开发，就像将棋一样把希望寄托在个人开发者上了。

后来问了几位开发者的人，关于技术我们都聊得很开心，但是到了最后总是会问一个问题：“日本这样下去还好吗”（苦笑）。

白鸟士郎：但是就这么开发出来的绝艺也很强啊，他们究竟是投入了多少资源呢？可以体现中国IT行业已经遥遥领先很多了。

大桥拓文：围棋大致是被分为日本规则和中国规则。GLOBIS-AQZ是根据黑贴6目半进行开发的。

但是在欧美国家，出现了像抖音一样禁止中国软件入境的情况，所以即便现在国外能用他们的围棋AI，说不定有一天就不能用了。

白鸟士郎：为了避免这种情况，自己国家也需要开发才行，但是这样的话需要花大量的资源，确实是一个很复杂的问题。

附件: 您需要登录才可以下载或查看附件。没有帐号？注册

返回列表

【对话】百分比和目数——当今围棋界和AI的共处方式（7）

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]