2018年05月02日 09:36 新浪体育
BensonDarr
本文来自微信公众号“新智元”(AI_era),来源:腾讯野狐围棋、微信派
在4月28日结束的世界人工智能围棋大赛上,腾讯AI Lab开发的“绝艺”意外输给了Phoenix Go,屈居第二。
Phoenix Go是微信翻译团队开发的人工智能围棋,算是“绝艺”的小弟,它们两个都出自腾讯,可谓“同根生”。
不同的是,Phoenix Go的优势在于,它基于AlphaGo Zero论文实现,同时做了若干提高训练效率的创新,并利用微信服务器的闲时计算资源进行自我对弈。
目前,PhoenixGo已经战胜过200多位人类棋手,这次战胜“绝艺”倒是出乎所有人的意外。
认识PhoenixGo:曾被认为是百度、阿里、Zero养的“金毛”
2018年初,PhoenixGo以Bensondarr等账号在腾讯野狐围棋上进行实战,目前已经战胜200多位棋手。
在公布正式身份之前,社区、贴吧等上面关于BensonDarr的猜测众多。
有的说BensonDarr的首字母缩写是“BD”,就是百度的狗,也有的注意到BensonDarr从来没有和绝艺指导下过棋,这很难解释。正常的话,其它AI应该都是非常渴望挑战绝艺,因此可能是阿里的狗。
看到Bensondarr这么强大,也有人说是Zero。
而Bensondarr换了金毛的头像后,就被棋友称为金毛。
这只金毛在野狐围棋上名气越来越大,直到世界人工智能围棋大赛在今年4月20日公布参赛阵容时候,它的身份首次公开:就是“绝艺”的自家兄弟PhoenixGo。
PhoenixGo是微信的几名工程师在开发机器翻译引擎“之余”抽空研发的AI程序。它基于AlphaGo Zero论文实现,同时做了若干提高训练效率的创新,并利用微信服务器的闲时计算资源进行自我对弈,缓解了Zero版本对海量资源的苛刻需求。
微信团队没有公布如何基于AlphaGo Zero论文实现,不过去年10月,DeepMind在Nature的一篇论文中,描述了AlphaGo Zero 的技术细节。
AlphaGo Zero完全不依赖于人类数据,因此,这一系统的成功也是朝向人工智能研究长期以来的目标——创造出在没有人类输入的条件下,在最具挑战性的领域实现超越人类能力的算法——迈进的一大步。
作者在论文中写道,AlphaGo Zero 证明了即使在最具挑战的领域,纯强化学习的方法也是完全可行的:不需要人类的样例或指导,不提供基本规则以外的任何领域知识,使用强化学习能够实现超越人类的水平。此外,纯强化学习方法只花费额外很少的训练时间,但相比使用人类数据,实现了更好的渐进性能(asymptotic performance)。
AlphaGo Zero 在其他方面也与之前的版本有所不同:
AlphaGo Zero 只使用围棋棋盘上的黑子和白子作为输入,而上一版本的 AlphaGo 的输入包含了少量人工设计的特征。
它只使用一个神经网络,而不是两个。以前版本的 AlphaGo 使用一个“策略网络”(policy network)来选择下一个落子位置和一个“价值网络”(value network)来预测游戏的赢家。这些在 AlphaGo Zero 中是联合进行的,这使得它能够更有效地进行训练和评估。
AlphaGo Zero 不使用“走子演算”(rollout)——这是其他围棋程序使用的快速、随机游戏,用来预测哪一方将从当前的棋局中获胜。相反,它依赖于高质量的神经网络来评估落子位置。
(详细细节请阅读新智元文章《[21天完虐Master]AlphaGo Zero横空出世,DeepMind Nature论文解密不使用人类知识掌握围棋》)
PhoenixGo对战绝艺:腾讯自家兄弟的游戏
在世界人工智能围棋大赛半决赛,PhoenixGo和绝艺分别顺利击败Leela Zero和天算围棋,令决赛成为腾讯两兄弟的对决。
28日中午12:30,决赛首局开战。
八冠王古力九段受邀为棋迷解说。猜到白棋的绝艺一出手就有创新,左下面对金毛的托扳定式,绝艺没有采纳人类耳熟能详的打完粘上,而是走出二路倒虎的新手。
随后的进程,绝艺一直保持着大贴目下白方的后发优势。不过双方差距并未拉大。
进入官子,执黑的金毛在下方二路大跳,入侵白空。绝艺出人意料的脱先跑到右上扳角。嗅到机会的PhoenixGo出手狠辣,147凌空一挤,左上一队白棋突然面临生死之危。
突然而至的危机,并不会让AI慌乱。
实战绝艺顺利将大队人马完整连回,但是胜负的重点仍在他处。继续掌控先手的PhoenixGo回到下边,令白棋目数大幅缩水。绝艺弈出一路“金鸡独立”经典手筋,PhoenixGo177妙手一靠还以颜色。此处战罢黑棋彻底完成逆转。
又进行了40手,绝艺中盘认输。
发球局被破,绝艺的决赛之旅顿生坎坷。
第2局拿到白棋的PhoenixGo发挥出色,始终保持着贴目优势,弈至159手绝艺强行收下右边官子,打破局面平衡。
面对绝艺的进击,PhoenixGo态度同样强硬,一刀切断黑棋19子大龙归路。惨烈的攻杀开始,黑棋大龙几经辗转,弈至191手虽能从上边凿出缝隙回家,但要付出左上角被吃的代价。
见此情景绝艺团队主动认输,比分变为2:0,PhoenixGo已经提前夺冠。
最终,Phoenix Go 2:1击败绝艺,赢下本届AI大赛,智能围棋世界冠军榜上又添新成员。
“星阵”战胜柯洁,国产AI围棋崛起
中国作为围棋的发源地,在AlphaGo诞生后的几年里也成为主要的AI围棋源头之一。
被同门兄弟击败的“绝艺”,是腾讯AI Lab于2016年3月4日开发出的AI围棋,当年8月绝艺就首次战胜职业棋手,11月第一次战胜世界冠军棋手江维杰(野狐ID若水云寒)。
2016年11月“绝艺”首次和柯洁交手,成绩一胜一负;2017年2月14日以后,绝艺对野狐帽子(世界冠军和全国冠军)的胜率,已经能够稳定在90%以上。不久前,“绝艺”还成为中国围棋国家队的训练工具。
在PhoenixGo战胜绝艺的同一个赛场上,另一家国产AI围棋“星阵”战胜了柯洁。
星阵的前身是清华大学由小川团队研发的“神算子”,曾在比赛中战胜世界冠军孔杰九段。
据“AI前线”报道,由小川曾介绍,星阵也借鉴了AlphaGo的基本架构,但在特征体系、模型结构、MCTS 算法架构等方面有所创新,力争用更少的计算资源和更少的训练样本完成模型学习。
现在,AlphaGo已经退休,但是它启发的无数后来者站在巨人的肩膀上,不断探索计算的奥秘。 |