返回列表 发帖

【对话】百分比和目数——当今围棋界和AI的共处方式(7)

找借口安静  2021-06-07

原址:https://bunshun.jp/articles/-/43711
原题:いま囲碁界で起きている“人間とAI”の関係──「中国企業2強時代」「AIに2000連敗して人類最強へと成長」将棋界とは異なるAIとの向き合いかた
摘自:文春Online
图片:ITMedia、h-eba
记者:白鸟士郎
嘉宾:大桥拓文 六段
翻译和整理:找借口安静 这个专栏争取这个月结束


白鸟士郎:那么,围棋AI是用百分比表示形势的吗?将棋AI用的是点数。

大桥拓文:围棋的话就用比如“黑胜率55%”的方式表示形势。但是最近感觉这个数字也很有意思。在胜率下面显示目数的正是星阵,感觉这个搭配让星阵变得越来越强了。

白鸟士郎:两个数值放在一起吗?

大桥拓文:是的,因为围棋是看谁围的地盘多的游戏,所以之前的AI即便说黑棋胜率90%,也是不知道究竟是赢了50目还是1目。

如果胜率90%的情况下只领先1目,那么一个小小的失误就能被逆转。但是AI不怎么失误,所以就有90%的胜率,但是人类经常会出现失误,所以这个时候完全就谈不上是90%的胜率。然后星阵就会告诉我们,这里的黑90%是黑领先1目,告诉我们更贴近人类的胜率。

然后最近还出现了KataGo的围棋AI,这个AI也是免费开源的软件,有很多开发人员对其进行改造。就像将棋界的软件“Yaneura王”一样。

如果只说开源软件的话,到去年为止Leela Zero最有人气,但是现在感觉KataGo的人气更胜一筹,因为KataGo可以显示目数。

白鸟士郎:会帮你显示出,你领先多少目那样的数据吗?

大桥拓文:是的。最近大家流行用的是星阵和KataGo,但是开源软件的话,感觉KataGo更好一些。

白鸟士郎:如果能计算目数的话,也就是说深度学习里面最薄弱的终盘能力得到加强了吗?

大桥拓文:是的,本身深度学习最擅长的就是识别图像。围棋就像点画一样,深度学习可以从局面识别能否赢棋。但是需要计算目数,所以需要搜索更多的东西,当然刚开始就让AI学习这个技术,确实是很困难的事情,但是一旦走上正轨的话,渐渐觉得这样能让AI变得更强。

不过这也不能说完全刻画了人类的思路,现在我们的目标就是做出更加像人类的AI。

白鸟士郎:这么说,AlphaGo出现之后年轻棋手们看着胜率进行思考,现在他们就根据目数进行思考了吗?

大桥拓文:这是一个很复杂的地方,像KataGo和星阵,就把胜率和目数都显示在棋盘上,进行形势判断。

但是目数的表示很细微,第一选点和第二选点的差距有可能就只差0.1目。


白鸟士郎:原来不是差1目,而是小数点以下的差距啊。

大桥拓文:有时候第一选点和第十选点的差距就差1目,这也是常有的,

白鸟士郎:哇,这样的话确实不知道下在哪里好了。

大桥拓文:具体来说,我的话布局阶段就看胜率,然后到了终盘就看看目数。

布局阶段有时候第一选点和第七选点就差1目棋,我们吃透这些变化难度实在是太大了(笑)。

不过胜率的话就会差7%,比如说49%和56%,是不是差了很多?

白鸟士郎:电脑告诉我们胜率以及目数这样明确的数字,这样人类的学习效率是否提升了呢?

大桥拓文:还是有了目数之后,棋手们的学习效率就提高了很多。有时候AI显示胜率70%,但是赢10目的70%,和只差1目的70%,我们在这方面有很多不懂的地方。

但是有时候“这里就差1目怎么就70%呢?”,或者“我吃了这么多棋,怎么胜率就70%呢”之类的想法。

白鸟士郎:这样的话,那个胜率70%更好理解呢?

大桥拓文:这个要看情况,有时候即便能吃很多棋,然后你全部下对,把对手吃掉的话就能赢棋,但是有时候哪怕下错一手棋,胜率就会大幅下降。

白鸟士郎:原来如此,即便只差1目,有时候不用费尽周折,可以说安全运转就可以赢了,这一点和将棋很像。

大桥拓文:这就是“胜率的反乌托邦”(笑)。即便是将棋软件,把数字和百分比组合在一起的话,有可能也会变强的。

如果围棋的目数用将棋思路进行比较的话,比如说可以制造一个用最短的次序进行收束的AI。

白鸟士郎:原来如此。

大桥拓文:还有就是,Zero系列的深度学习软件,需要花很多的资金。所以希望开发将棋AI的各位能找到更有效率的方法,然后能运用在围棋领域的话就最好了(笑)。

白鸟士郎:资金就是,为了开发投入了多少钱吗?

大桥拓文:开发AlphaGo的DeepMind团队,为了开发就从谷歌借了服务器,然后花了3500万美元,看到这个新闻吓了一跳。

白鸟士郎:啊?一美金大概换算成110日元,大概是40亿日元?啊?为了开发深度学习,花了这么多钱吗?

大桥拓文:总之需要庞大的资源,用AlphaGo举例的话,TPU用了2000基,然后Facebook在开发ElF Open Go的时候,也用了2000基的GPU。我们在开发GLOBIS-AQZ的时候,也用了1000基。

白鸟士郎:1000!需要这么多吗?

大桥拓文:1000基,在日本也是基本上做不到的。

白鸟士郎:那么是要用海外的服务器进行开发的吗?

大桥拓文:不是,我们用的是产业技术综合研究所的大规模AI云计算程序“ABCI”。

白鸟士郎:产业技术综合研究所的ABCI,明白了。在2018年还是有着世界前五性能的大规模云计算系统。有4352基的高性能GPU,原来这样的系统在日本也有呀。

大桥拓文:在那边有4000基以上当时最好的GPU——V100,我们用了大约1年的样子。我们最多的时候用了1000基,真的很感谢他们。

但是GLOBIS-AQZ的开发现在也停下来了。现在不再以企业为单位进行大规模的开发,就像将棋一样把希望寄托在个人开发者上了。

后来问了几位开发者的人,关于技术我们都聊得很开心,但是到了最后总是会问一个问题:“日本这样下去还好吗”(苦笑)。

白鸟士郎:但是就这么开发出来的绝艺也很强啊,他们究竟是投入了多少资源呢?可以体现中国IT行业已经遥遥领先很多了。

大桥拓文:围棋大致是被分为日本规则和中国规则。GLOBIS-AQZ是根据黑贴6目半进行开发的。

但是在欧美国家,出现了像抖音一样禁止中国软件入境的情况,所以即便现在国外能用他们的围棋AI,说不定有一天就不能用了。

白鸟士郎:为了避免这种情况,自己国家也需要开发才行,但是这样的话需要花大量的资源,确实是一个很复杂的问题。
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表