返回列表 发帖

如何看待 Google 围棋 AI AlphaGo 击败欧洲围棋冠军?

来源:知乎 高飞龙 ,雕翎不腐,鼎镬不锈。  2016-02-07

  一个月前,DeepMind创始人Demis Hassabis曾说道很快会有关于围棋研究的惊喜,而1月28日的《Nature》杂志即将以封面论文的形式介绍Google旗下人工智能公司DeepMind开发的一款名为AlphaGo的人工智能,它已经击败了欧洲围棋冠军,并将于3月与世界冠军李世乭对战。该程序采用了两个深度神经网络,policy network与value network,极大地降低了需要考虑的搜索空间的复杂度,前者降低搜索的广度,后者降低搜索的深度,很像人脑在下围棋时凭直觉快速锁定策略的思维。

  这么说起给一点时间,巅峰的吴清源,李昌镐这类人物(即使不断学习)也是下不过电脑的了? (我指的电脑就是2015一台中等配置的PC这样,不是服务器集群,类似普通电脑跑Pocket Fritz 4)

  Update: (3-15-2016) Alphago 最终4:1战胜Lee Sedol

  -
  “珍珠港遭到空袭!这不是演习!这不是演习!这不是演习!”
  ——2016年1月28日凌晨

  -
  从昨晚开始,一条声称谷歌AI在19路棋盘上分先战胜樊麾二段,并且论文已登上Nature的消息刷爆了朋友圈。
  一开始,就像以往的那些“大新闻”一样,大家都认为是标题党,甚至某业余7段还查验到其论文尚未被Nature审核通过。
  然而随着时间的推移,越来越多的近距离详细消息传来,开始有人相信消息的真实性。
  围棋圈内的各种微信群、朋友圈都在不断的争论,相信的人越来越多,不信的人也坚持己见。

  终于,在接近凌晨两点,又一条最新报道来了,这次还附带着棋谱:
  面对谷歌围棋AI,人类最后的智力骄傲即将崩塌……(虽是真消息,但稍有标题党之嫌)
  至此,看到棋谱的所有人几乎都相信了:人工智能AlphaGo,实现了里程碑式的一步。

  -
  首先,在客观上要肯定AlphaGo实现的水平进步。

  从昨晚开始,一条声称某AI在19路棋盘上分先战胜范麾二段,并且论文已登上Nature的消息刷爆了朋友圈。
  一开始,就像以往的那些“大新闻”一样,大家都认为是标题党,甚至某业余7段还查验到其论文尚未被Nature审核通过。
  然而随着时间的推移,越来越多的近距离详细消息传来,开始有人相信消息的真实性。
  围棋圈内的各种微信群、朋友圈都在不断的争论,相信的人越来越多,不信的人也坚持己见。

  终于,在接近凌晨两点,又一条最新报道来了,这次还附带着棋谱。
  以往最强的围棋AI,大致是CrazyStone、Zen和银星围棋这几个。
  而AlphaGo在让以上几个程序(无银星围棋)4子的情况下,取得了80%左右的胜率。我们据此基本可以判断,人工智能将自己的水平上限一下子提高了5个子

  樊麾二段,虽然以欧洲冠军闻名于世,但其实圈内谁都知道他是一名中国旅欧教学的职业棋手。
  虽然远离东亚职业一线,但樊老师的水平仍然是不容置疑的,他依然有着职业的水平(虽然是较弱的职业),一般的业6仍然是比他不上的。
  AlphaGo在正式比赛中对樊老师5:0(棋谱已可见),据说加上非正式比赛的总分为8:2(已确认),再加上棋谱里AlphaGo显示出的惊人的表现,我们可以认为,人工智能在围棋上的水平已经迈入了职业的大门。
  (最新:据多位顶尖棋手对棋谱的鉴定,认为AlphaGo的水平应该在业余强6段到弱职业之间,离人类顶尖大概还有一先到两先的差距)
  (对于西方围棋包括樊老师的相关介绍,可见西方人的围棋水平如何? - 高飞龙的回答

  说的更明白点,之前的AI在蒙特卡洛算法的帮助下虽然取得了革命性的进步,战胜了绝大多数的人类,但人类中能战胜那些AI的人数可能仍然在近百万的量级。
  而自今日(其实已经是三个月前了)的AlphaGo起,能在围棋盘上战胜AI的人类人数可能已经不到千人了。

  按照 @田渊栋 老师的说法,这个消息在相关研究圈内应该早就不是新闻了。
  甚至回想一下昨天扎克伯格在facebook上突然发声支持自己的研究团队,也因为是知道了google团队的成果即将在一日内公示,所以想要在舆论中抢占一个位置。
  (田老师参与的facebook的研究团队,是google现在最大的竞争对手,田老师他们使用的方法应该不太一样,虽然他们暂时落后,但我同样也很期待他们的下一步进展)

  总之,这真的不是演习。

  -
  接下来谈点个人对人工智能的粗浅理解。
  近些年来,尽管在蒙特卡洛算法的帮助下,AI实现了革命性的进步,达到了能战胜大部分人类的水平(中等业余5段),但随着摩尔定律的走向终点(据某it界前辈指点,摩尔定律并非舆论所说的即将结束,而是转换为了新的形式),计算机硬件的发展速度在旧有的道路上暂时无法按以前的速度继续爆炸发展下去,大家都认为仅凭蒙特卡洛算法是无法帮助AI战胜人类的。

  依据个人的理解,我曾在围棋棋力业余低段位,如何继续学习提高?有什么推荐的参考书目和学习方法? - 高飞龙的回答中将围棋的思维过程分解为四步的演进:常识→棋感→计算→判断

  大约一年前,我曾和李喆六段就此问题进行过简单讨论,当时我认为蒙特卡洛算法的成功主要在于为人工智能建立了“棋感”,而以往的人工智能只在“常识”和“计算”方面具有天然优势。
  在蒙特卡洛算法之前,虽然计算机凭借强大的计算力可以积累大量“常识”,但由于“棋感”的缺失,人工智能无法对计算方向进行有效的筛选,最终就不免沦于蛮力搜索。
  而蛮力搜索虽然可以在一定程度上实现高水平的“计算”,甚至很多其他棋类都在这一环节上被人工智能打败,而由于围棋的过度复杂和摩尔定律结束对计算机发展前景的限制,走到这一步仍然无法让人工智能战胜人类。


  (注:上图为计算机眼中的国际象棋落子思路,而下图为计算机眼中的围棋落子思路,来自谷歌deepmind官网AlphaGo | Google DeepMind)


  而蒙特卡洛算法出现后,凭借大量储备的棋局,通过胜负概率来判断下一步着点以作为计算方向,极大的提高了计算的效率,所以AI的水平才实现了革命性的进步。

  而这次的AlphaGo,使用了深度神经网络与蒙特卡洛树状搜索相结合的方法。
  依据已经能看到的Nature上的论文
  http://www.nature.com/nature/jou ... ll/nature16961.html,研究者们在AlphaGo中加入了两个深度神经网络,以value networks来评估大量的选点,而以policy networks来选择落子,并且开发了一种新式算法来结合蒙特卡洛算法和以上两个神经网络。


  注:上图为AlphaGo使用的神经网络结构示意图,来自原论文)
  在这种结合下,研究者们结合参考人类职业对局的监督式学习,和AI大量积累自对弈实现的深度学习,来训练和提高AI的围棋实力。

  在蒙特卡洛算法之后,我看到了新的天地。
  这种结合以及新式的思路,让人感到前景无限。

  -
  最后谈一谈,我认为我们应该保有的态度。

  这里,我首先想引用李喆六段在今天早上说的话:
  “我们已来到两个时代的连接处,无论你是否愿意,这都是一个需要接受的事实。工具无善恶,善恶在人心。未来的路通往何方,将由我们自己决定。”

  从凌晨到早上,朋友圈里的评论区一直争论不休,甚至某世界冠军一直在说“不信”,毕竟大家在没有看到板上的钉子之前,从情感上都是不愿意相信的。
  直到另外两位一线棋手告诉他,已经可以看到棋谱了......

  面对这个事件,接下来将会有很多的爆炸性新闻报道,以及各种各样姿势的讨论。
  我们要知道:
  一.人工智能的确实现了很大的进步。
  这次的进步可能是革命性的,这次新闻宣称的AI取得的成绩并不是“标题党”。

  二.人工智能还没有战胜人类(什么所谓“人类最后的骄傲陷落”都属于“标题党”)。
  但AI已经朝着这个方向迈出了一大步,而且是在很多人在蒙特卡洛之后不看好AI下一步发展的情况下,来了一个突然袭击(谷歌从开始研究到出成果再到发布,一直憋一个大新闻憋这么久也真是能忍)。

  三.人工智能战胜人类的时点,可能比很多人想象的要来的更早了。
  不是之前设想的生物计算机或者量子计算机出现后,甚至都不是新材料制成的处理器取代硅晶片之后,而是在这个时代就有可能出现了。也许是五十年后,也许是二十年后,甚至可能是十年后。

  从小学时开始,我就痴迷于许峰雄教授对于计算机国际象棋项目的研究和成就,一直追踪到97年“深蓝”战胜卡斯帕罗夫。(就是在那之后不久,我才从国际象棋转投了围棋......)


  (注:上图为第一个打败人类的计算机国际象棋程序“深蓝”之父——许峰雄)

  从中学时代到大学时代,我一直追寻着许教授的动态和他撰写的各种文章、书籍,他写的《“深蓝”揭秘》被我翻的都烂了,我甚至在中学时代一直想以此作为未来的求学从研的方向。
  许教授离开IBM、前往亚研院并声称准备致力于作为最终问题的计算机围棋难题之后,我仍然一年年心心念念的期待着许教授的后续动作。

  然而十多年过去,等来的却是无数的后来者。
  这也挺好,人类就是不缺后来者。

  看许教授对当年研究过程的讲述,最大的感受就是:
  其实并不是计算机打败了人类,而是人类打败了人类。

  大量的计算机专家,配合大量的国际象棋职业棋手,在算法上不断革新,再搭乘上摩尔定律的东风,不断的失败再重来、输了再修正,最终才解决了计算机国际象棋难题。
  卡斯帕罗夫,是败给了数以百计的人类专家的智慧的合力。

  围棋也会是一样,计算机——今天说人工智能更合适,战胜人类的那一天迟早会来,大部分人都从来不否认这一点。
  争论,始终在于这一天的早晚。

  而棋手和围棋从业者们,出于可以理解的感情,总是希望并认为这一天不会来的那么快,但他们绝对不会拒绝甚至仇视这种进步。
  其实我看到的很多人,都一直期待并赞许着人工智能的进步,甚至很多职业高手还亲身参与和帮助着计算机围棋项目的研究。

  我们努力打造着一个“大玩具”,一个能战胜自己的“大玩具”。
  所以最终的成功,是我们人类自己的成功,而不应该对计算机感到恐惧。

  同时,这“大玩具”也不只是好玩而已,人工智能对于现代乃至未来科技的发展有着极大的意义,这意义甚至会超出当年原子弹研究的后续红利。

  所以不要害怕,不要烦恼,让我们期待着人工智能在围棋上战胜人类的那一天的到来吧。
  我之前一直认为在我有生之年是看不到这一天的,然而现在看来,我错了。
  我一点也不失望,反而感到很兴奋,很激动,并且期待着以google和facebook为首的前沿研究团队们的进一步的表现。

  最后的最后,恭喜谷歌,恭喜围棋,恭喜人类。
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表