标题: 围棋 AI ELF OpenGo 迎来更新 另有棋局详细解读 [打印本页] 作者: 天马行空 时间: 2019-2-16 10:51 标题: 围棋 AI ELF OpenGo 迎来更新 另有棋局详细解读
2019年02月16日 10:05 体育综合
[attach]141818[/attach]
ELF OpenGo资料图
雷锋网 AI 科技评论按: Facebook 人工智能研究院(FAIR)于去年开源的 ELF OpenGo 日前再度迎来更新,本次 FAIR 不仅发布了该系统新的功能和研究成果,还发布了可在 Windows 上运行的 AI 版本,让围棋棋手能更易于使用该系统来帮助自己训练。以下是田渊栋等人对该开源项目的详细解读,原文发布在 FAIR 的官方博客上。
自去年 Facebook 人工智能研究院(FAIR)发布了 ELF OpenGo,AI 研究人员就利用该围棋 AI 来更好地理解 AI 系统是如何学习的,同时围棋爱好者也将它作为一位最先进的 AI 对手进行对战来测试自己的水平。这个开源 AI 在与人类的对战中表现非常出色,其中就包括以 20:0 的战绩击败了围棋职业棋手,同时,它也已被 AI 研究界广泛应用于执行围棋实验,并重新产生了其他结果。ELF OpenGo 在基于 AI 的围棋比赛中也已经对战了从它自身修改而来的多个版本。同时,它也作为人类的队友参加了围棋比赛,包括参加美国围棋大会混双赛,在这个比赛中,每个队由一位人类选手和一个 ELF OpenGo 系统组成,他们共同对战另一个人类与 AI 联合组成的战队。
日前,我们对 ELF OpenGo 进行了更新,并发布了其新的功能和研究成果,包括从头开始重新训练的经过更新的模型。同时,我们还发布了可在 Windows 上运行的 AI 版本,让围棋棋手能更易于使用该系统来帮助自己训练,另外,系统对于这些棋手来说也是一个独一无二的「档案馆」,里面展现了 ELF OpenGo 对 87,000 场围棋职业比赛的分析。现在,棋手们可以也看到系统是如何排出 18 世纪的最佳职业棋手,如何对这些棋手的表现进行细致的评估,并最终回归到特定的比赛中的个人表现。我们非常高兴看到这个通用平台经过改进,能够帮助研究者更好地理解 AI 以及围棋界的棋手们也可以使用该平台来磨炼他们的技能并研究围棋赛事。
韩国棋院的公关助力总监 Beomgeun Cho 就曾表示:「我可以肯定地说,ELF OpenGo 开源项目给韩国的围棋界带来了巨大的影响。自它问世以来,韩国几乎每一位竞赛型职业棋手都在使用 ELF Go 程序来分析他们自己以及其他棋手的对战情况。并且正是因为这样,不仅韩国的围棋水平得到提高,整个世界的围棋水平也得以明显提升。」
让每个人都能用到强大的 AI
当 DeepMind 在 2017 年发布 AlphaGo Zero 时,就展示了拥有 4000 年历史的围棋作为深度强化学习(RL)相关研究者的试验台的价值。由于其高分支乘数、卷积交互及复杂模式,有效的围棋 AI 必须泛化到没见过的复杂场景中,来探索并找到新的策略。它提供了一个上百万种潜在的移动组合环境,不过缺少了隐藏的或基于偶然性的游戏机制(例如滚动式骰子或洗牌)。不过虽然 AlphaGo Zero 和它的进化版本 AlphaZero 都已经证明了 AI 系统经过训练后可以持续地打败人类围棋棋手,但是对于更广大的 AI 研究界来说,它们的作用更多地是作为一个深度强化学习的成功案例而非一种工具。
作为其开放科学实施中的一部分,FAIR 去年发布了 AlphaZero 的另一种实现方式——ELF OpenGo,让其他研究实验室能够更加深入地了解这些方法的工作原理。该模型的开源同样为未来的研究工作提供了一个必不可少的基准。然而 FAIR 也意识到,由于该模型需要巨大的计算资源,大多数的研究者即便使用开源的代码也无法获得与其相同的结果。这就是为什么我们再度发表一篇新论文(论文查看地址:https://dl.fbaipublicfiles.com/elfopengo/pdf/arxiv.pdf),基于从头开始进行重新训练的 ELF OpenGo 与大家分享一些新的思想。这篇论文很好地解释了为什么 AI 在与人类棋手的对战中有这么强大的表现,并阐明了科技的局限性,而这种局限性是可以帮助研究者更好地理解 AI 系统的潜在机制并将其应用到其他的场景中的。
ELF OpenGo 同时也强调了 AI 对围棋的明显影响。例如,ELF OpenGo 的一致性概率随着时间的推移趋于增加,这表明了围棋的总体水平与日提升。
该系统对特定棋手的评估也会随着时间的推移而提高,这表明了他们在职业发展过程中的进步。事后看来,这些观察结果可能是显而易见的,但 ELF OpenGo 量化了这些进展,并发现了个人的围棋水平明显会随着时间而发生变化。2016 年棋手的落棋方式与 ELF OpenGo 推荐的的落棋方式的一致性突然而全面地增加,也会增强人类的这一信念:引入强大的 AI 对手有利于提升职业棋手的水平。这种显著的相关性不是决定性的——人类的围棋水平也有可能由于其他原因显著提高,但作为一个案例,从现在以及历史角度来看,它都很好地体现了一个经过训练来执行指定任务的系统也可以对更广泛的领域进行更广泛的分析。
围棋 AI 下一步该怎么发展?
虽然 ELF OpenGo 已经被世界各地的研究团队和棋手广泛应用,但我们也很高兴将去年的版本扩展为更广泛的一项开源资源。对于围棋爱好者来说,该系统对职业围棋比赛的分析可以作为一种新型的训练辅助工具,能为他们提供一个超越人类的 AI 棋手在围棋不同阶段的表现参考。此外,我们出于训练目的,还增加了 AI 本身的开放性,并发布了围棋棋手可以下载并进行对局的可在 Windows 上运行的 AI 版本。
不过,无论是对于 ELF OpenGo,还是在开发能向人类一样有效学习的 AI 的更大项目中,FAIR 还有很多工作要做。ELF OpenGo 能够击败人类专家,但这仅仅只能在其与自己对弈百万场比赛之后才能实现。它如何从众多案例中的一小部分中学习,同时更快地掌握「征」等概念并最终实现更好的表现?通过将我们的工具和分析全面开放给大家,我们希望能够加速 AI 界更快地追寻到这些问题的答案。