2018年04月30日 11:50 体育综合
凤凰围棋在AI比赛中
来源:弈客围棋 作者:狮子头
“贝瑞基因杯”2018世界人工智能围棋大赛今晚闭幕,来自腾讯微信团队的凤凰围棋在决赛三番棋中以2:1力挫老牌的王者绝艺,首次亮相世界赛就摘得了桂冠。赛后,狮子头迫不及待,找到了沉浸在胜利喜悦中的团队,进行了采访。
狮子头:恭喜凤凰围棋(以下金毛)获得人工智能围棋世界大赛的冠军,先介绍一下创造神奇的团队吧。
金毛:谢谢!很高兴接受弈客的采访。好汗颜,我们的团队都不太会下围棋,最高水平可能在18K以下吧(笑)。团队的开发工程师有5位。
金毛:我们是微信AI团队的一部分。微信中有很多AI的业务,比如语音输入法,英中互译。我们的主业是做微信翻译。去年10月份,Deepmind的Zero论文发布不久,我们正好有一些空余时间,当时我们正在做一个很大的基于云端的人工智能训练平台,支持包括深度学习在内的各种机器学习模型,我们需要有一个东西去完善我们这个平台,同时我们也想学一下最新的AI技术,看到Zero论文之后,我们觉得Zero的想法非常棒,正好符合我们的想法。
狮子头:从算法层面,除了遵循“Zero”的算法,有没有其他更新的研究?
金毛:首先我们会根据TA的最基本想法,不会使用人类的棋谱进行训练。但是我们真的没有那么Deepmind那么多资源,我们没有几千个GPU,所以就回到前面说的那个基于云端的一个机器训练平台,我们是使用微信的后台空闲的服务器资源。当晚上微信服务器比较空闲的时候,它就左右互搏,帮我们去生成一些棋谱。这些服务器白天的时候是要服务微信用户的(微信聊天、朋友圈等)。生成棋谱基本上是由CPU服务器完成,做神经网络的训练,还是用了那么一两台GPU服务器。
狮子头:您预测什么时候能真正达到AlphaZero最终的水平 ?
金毛:首先没那么多硬件资源,也不可能有那么多的资源投放进去。其次我们需要精打细算,做一些效率改进,提升训练的效率,因此不可能很快达到它的水平。去年10月份论文公布,我们开始学习,到了春节前,大约1月份开始尝试在网上进行一些实战,真正开始大规模的训练是在大概春节后;所以我们到现在为止也就大概训练两个多月,我们见缝插针地使用空闲的服务器,任何一台服务器忙了我们就不能使用。在目前的状态下,我们也很难预测什么时候能达到AlphaZero的水平。一切还得看微信服务器的空闲资源。
狮子头:LeelaZero 已经训练了大致700万谱,每天还在不断增强。AlphaZero总共训练了2700万谱,你们准备训练多少?
金毛:我们的路径不太一样,我们需要提高效率,使用更少的训练量达到满意的效果。
狮子头:这个项目还会继续吗,还会继续参加AI的世界大赛?
金毛:一切都还不确定,目前我们已经达到了一个里程碑,阶段性的目标已经完成,这次参赛本来觉得进入决赛就非常满意了,拿到冠军实在喜出望外。
狮子头:这次参加比赛之前,有没有对其他AI做一些了解?
金毛:我们所有的对局大家都能看到。我们在明别人在暗。别人的马甲上来打我们,也是帮我们测试了:)。我们需要按照一个系统工程方法,保证忠实的实现。第一是忠实实现;第二提高我们的训练效率,因为我们没有那么多GPU;第三就是说我们的云训练平台要进一步完善。
狮子头:预测一下现在你的这个棋力和比如说像柯洁这样职业顶尖棋手,他们跟和你差距有多大?
金毛:如果您观察我们公开的历史棋谱,其实上面有很多局,我们都是用一台家用的单机在打,甚至配置比一个单卡的1080Ti还要低。根据这些线索大致可以估计我们的棋力水平。实际上我们没有严格去做过类似的测试。
狮子头:今后有计划到其他围棋赛事上继续表演吗?
金毛:我们最初觉得能进决赛已经很开心了,现在拿到冠军更是意外之喜,这个目标已经完成了。所以下一步可能我现在也没法做一个决定,我们需要继续讨论。我们这个团队本来的目标也不是为了做出一款围棋产品,只是想这个机会学习学和实践AI新技术。
狮子头:现在的Block已经达到几层了?
金毛:稍候我们会详细公布金毛的一些指标,我们使用家用机的配置和职业棋手较量,如果Block太高,机器可能根本跑不起来。
狮子头:有些AI,比如星阵,除了下贴七目半的围棋以外,可以做到动态改变贴目数。现在大部分的AI都是根据胜率来下棋,在确保胜率的情况下,他的棋风可能会偏向退缩,保守 ? 你们是不是已经储备了可以用动态贴目,包括下出这种追求极致不退让棋风等技术储备?
金毛:我们对于星阵了解也是刚刚开始。我们主要是做Zero的方法。我们觉得也许人类的一些认识跟AI的认识是不一样,没有退缩一说。他就是追求胜利,那你胜率提高,你说他是退缩还是不退缩呢? |