返回列表 发帖

人类拖了AI的后腿吗? 彭圣才读Nature论文有感

2017年10月22日13:10 新浪综合


资料图



  文章来源:彭圣才微博

  关于AlphaGo Zero,相信读者们过去两天已经被各种刷屏了。 AlphaGo自从 5:0 战胜樊麾惊艳亮相以来,差不多每隔半年就要来个大新闻,而我,作为一名曾经从事人工智能的围棋爱好者+产品经理,每一次我都及时出来蹭了热点,这一次也不例外。

  所不同的是,前几次都是为职业棋手站台,文章的主旨是为职业棋界加油打气,比如这篇:职业棋手,你们依然是我们这个星球上最聪明的人,还得到了柯洁 的10元打赏。而这一次,职业棋界已经坦然接受了这个事实,并且十分虚心的接受阿老师的指导。

  李世石输给AlphaGo的时候,我的某位职业棋手朋友还不大能接受这个事实,甚至表示棋谱有诸多可疑之处,网上甚至有些流言说李世石放水啊,谷歌和私下协议不 许打劫啦,等等。当时力挺AlphaGo的李喆六段还被职业棋界的不少人视为叛徒。然而,终究AlphaGo一而再再而三的证明了自己,刷新了我们的认 知,也终于平息了一切质疑。今天,包括柯洁在内的职业棋手,普遍表示AlphaGo 比自己至少强2子以上。更有人感叹,当年藤泽秀行老先生说:棋道一百,我只知七。 在今天看来,也许并非谦辞。

  虽然完全接受了AlphaGo存在的职业棋界,这次已经非常坦然,然而,在AI界,这次的震动却丝毫不小。原因无他,这次发表在Nature上的这篇文章叫:

  Mastering the game of Go without human knowledge

  围棋,英文称为Go,这个标题的意思就是 在没有人类知识的前提下掌握围棋。 相信这几天大家被各种刷屏文都科普过了,所谓的“无师自通”,“左右互搏”等等,在此我就不重复了,说说几个我觉得最神奇而有趣的体会:

  殊途同归

  在 Nature的论文中,谷歌公布了AlphaGo 在学习不同阶段的一些成果,非常有趣的是,虽然完全没有人类的干预,但是机器依然学会了人类流传下来的一些定式。 当看到神功大成的AlphaGo 依然开局第一手走在角上的时候,人类大约松了一口气。 至少 “金角银边草肚皮”还没被颠覆,之前已经有人在YY,也许第一手的最佳招法在天元呢。我自己看到论文中的这两幅图的时候,百感交集。


  左边这个定式即使在今天,依然是职业棋界流行的定式,可以看到AlphaGo在训练到10个小时左右的时候,就学会了这个定式。 而右边那个是著名的小雪崩定式,大约在15个小时的时候被习得,然而到70小时以后,这个定式就几乎不再出现了,说明被机器摒弃了。 在之前的AlphaGo的版本中,人类已经知道这个变化不好,所以现在职业棋手也基本没人下了。

  这样的殊途同归十分感人,时隔数百年的人类先后用不同的方法得出同样的结论,这种感觉十分奇妙。

  关于征子

  “征子”是围棋的一个十分基本的战术,基本小朋友启蒙阶段最开始的几节课就会学到这个,然而,AlphaGo非常晚才学会这个最基本的战术。从时间线上来说, 大致可以说水平几乎已经达到或者超过李世石的时候,它却还不会征子! 这是一个非常神奇的发现。 也就是说,虽然彼时这个机器的实力已经非常强了,可是由于不会征子,如果把这个时期的机器拿出来跟人对战,那么人类完全可以利用这个缺陷,故意利用机器不 懂征子产生误判,从而战而胜之。不过由于机器是自我学习,左右互搏,所以并不会刻意利用自己这样的缺陷。

  人类拖了AI的后腿

  一 个更有趣的事实是,一年前的版本,对于这样的一些缺陷,会通过“修bug”的方式,把一些较为基本的围棋知识,通过人工干预的方式来有意识的让机器更早的 习得类似的技能。 腾讯的“绝艺”团队,聘请了世界冠军罗洗河 来担任顾问,在很短的时间内就达到了李世石版本的AlphaGo水准。 当时我就论断,此举虽然短期进步神速,但是由于机器被越来越多的接受人类师傅的指导,其天花板将难以超越人类太多。 果然,今天的“绝艺”总训练量已经超过数十亿盘,但是水平再也难以进一步提升了。

  我想,这才是这篇论文能荣登Nature的最大意义,即 AlphaGo团队证明了,完全不需要人类的干预的情况下,机器虽然在某些基础理念上短期内不如人类,但是最终进化出来的水平远远超过人类,也超过以人类 棋谱作为训练集的机器水平。另一个略显讽刺的事实是,最早人工智能界为了检验自己的AI水平,设立了一个以人类职业高水平棋手对局库为基准的测试集,每一 个新研发的AI,会用这个测试集来计算,以预测出该对局库中下一手的成功率来作为一个衡量标准。

  最新版的AlphaGo Zero,虽然在对战中已经可以90%的概率战胜之前的Master版本,但是在这个测试中,却明显落后于Master……


  我想,谷歌是用这种方式,向世界宣布,从此以后,成功预测人类的下一手,已经不再适合作为围棋AI的评估标准。柯洁 在微博上说的那句:“原来是我们拖了后腿啊”也并非虚言。
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表