返回列表 发帖

重建一个“阿法零”要多少年?-吴博士:1300年?Leela:1700年?


阿法零的论文发布后不久CGI吴博士就在社交平台发布了对阿法零所用硬件的推测——




而Leela的作者更是已经GitHub开了一个名曰“Leela Zero”的项目,完全采用Alphago Zero论文中的算法,但是开源且可以让世界各地计算机可以执行分布式计算,以下为作者原文大意——

我想做什么:

这是一个没有人类提供知识的围棋程序。使用MCTS(但没有蒙特卡罗输出)和一个深度卷积神经网络堆栈。

这是对Alpha Go Zero论文中描述的系统的一个相当忠实的重新实现,“掌握没有人类知识的围棋游戏”,可以说它就是一个开放源码的AlphaGo Zero。

我现在需要重构Zero的价值网络。即使没有tpu,我建议使用GPU——虽然并不完全一样,但拥有完整价值网络的情况下仍然会比顶级人类强大得多。

使用单一一台商用配置的计算机(1080TI显卡)重塑AlphaGo零价值网络将花费大约1700年,

发布这个程序就是旨在建立一个公共的、分布式的工作来重复这项工作

它现在不是很强大(而且它基于人类对局中训练出来的,boo !),可以赢gnugo,但会输给任何稍微有点厉害的围棋AI。

如果有10台计算机参与,这个进程就会被缩减为170年,有朋友说或许会有上百人参与?我并不那么乐观,但愿自己是错的。

小编表示,这个项目虽然不见得会有实际意义但至少很好玩——

此外Leela最近还在10.24公布了最新0.11.0版本,有兴趣的棋友欢迎登陆官网https://www.sjeng.org/leela.html 下载使用。

作为一个完全免费AI,小编想说这位作者确实相当良心——友情提醒,想让Leela具备一定棋力需要一块不错的显卡。
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表