返回列表 发帖

AlphaGo与人类的恩怨情仇(4)-初试啼声:(下)

2017年6月10日   棋艺探索


本文首发于知乎专栏——不一样的围棋,作者,不会功夫的潘达

输棋后的樊麾表现得难以置信,但他并没有多少用来调整的时间。当天晚些时候,樊麾与AlphaGo再战一盘非正式对局。结果是樊麾取胜。棋谱没有公开,所以我们无从得知棋局中间发生了些什么。不过,樊麾大概恢复了一些自信,这可以在次日的第二盘正式对局中看出端倪。


AlphaGo(黑)- 樊麾(白)对抗赛第二局,1-12手

刚一开局,樊麾直接祭出“大雪崩”定式。此形如白雪从黑山坡上滑落(把上图的黑白交换一下即可),因而得名“雪崩”。“大雪崩”,与“妖刀”、“大斜”并称围棋“三大难解定式”,变化莫测,而且常有新变。大雪崩是难解定式中,近年在职业赛事中出现最频繁的一个。在2015年百灵杯决赛第三局中,邱峻就在大雪崩定式中藏了一把飞刀,令柯洁猝不及防,结果棋局早早失去悬念。既然顶级棋手在大雪崩中都会犯错,那么AlphaGo会如何表现呢?


1-44手

笔者棋力有限,对大雪崩的千般变化不甚了了。接下来一段的内容参考金明完九段的解说。

金明完认为,白26粘是旧定式。比较新的变化是改走E6位扳。如果AlphaGo不犯错,白26粘以下的变化应该是黑棋稍好。但紧接着,AlphaGo立刻犯下了一个错误:黑31。


如果没有实战中黑31与白32的交换(即上图中O与X),其它手顺保持不变,则G2位的黑9是先手。白棋必须在左下角补棋,否则被黑10立下全灭。黑9白10交换以后,白6、8气势汹汹的攻势显得相当浮夸。黑棋既可以A位轻松逃逸,或者B位穿断反击,令主动权易手。


如果是大雪崩的另一变,如上图,则白棋在B位点入,赚取官子便宜,且保证上边一块的眼位,就是正着。在此局面下,下边一块不再有先手,于是左边的点入也就不必保留。

AlphaGo在此处的错误,大概是策略网络从人类棋谱中学到了这一着,知道在相似棋型下,“点入”是有效的手段,但并不能准确的判断点入的场合。如果AlphaGo是一名人类棋手,可以评价为“知其然,而不知其所以然”。

随后黑棋甚至都没能将黑31一子救回,被白38先手笑纳,局部亏得吐血。持白棋的樊麾借着AlphaGo的失误,白40、42、44连续压迫,心情愉快。棋下到这里,也许樊麾觉得自己要赢了吧。


棋谚云,“一着不慎,满盘皆输”。之前顺风满帆的樊麾想以持续压迫黑棋巩固优势,却立即遭到AlphaGo的强力反击。黑55、57冲断白棋以后,白棋深陷乱战,54、58两子,及42这一块白子均有风险。不过,此处白棋若处理得当,脱困并不难,棋局还很漫长。然而……


白62,本局败招。此处的变化对于樊麾来说应该难度不大,实战犯下如此低级错误,可能是心态波动吧。被黑棋扳到71,白棋右下五子全灭,棋局实际上已无以为继。接下来的一百多手,白方奋力拼搏,但没有找到逆转的机会。本局双方各有犯错,但樊麾的错误更为严重,以至于“突然死亡”。

接下来的第三局,只说一个局部。


AlphaGo的白60,猛一看像是好棋。职业棋手常用类似手段,在边角处占一点便宜,或者制造一个劫争。然而,黑61挡,干净利落地吃掉入侵的白子。此处AlphaGo犯的错误和第二局大雪崩中的一“点”相似,都是在貌似可行的棋型下,实际上并不成立的手段。这可以解释为AlphaGo的策略网络已经能够敏锐地像人类高手那样感知棋型,并挑出候选的手段;但AlphaGo的后续计算准确度尚不足够高,导致有时仍会犯低级错误。

不过,即使AlphaGo在此处犯错,白棋依然掌握主动。白64断以后,黑棋在右上陷入苦战。最终黑右上被全歼,从而告负。至此樊麾以0-3落后。


在后来AlphaGo战胜樊麾的报导中,都有樊麾双手抱头懊恼的照片,棋盘上正是第三局的终局画面。

第四局,执黑的AlphaGo发挥近乎完美。


AlphaGo (黑) – 樊麾(白)对抗赛第四局,1-20手。

左边的定式,执黑的AlphaGo在11拆、13跳,堂堂正正,和人类教科书里的下法一模一样。之后我们还会看到左下角的“托退定式”,以及AlphaGo不一样的表演。

然后AlphaGo在右边布下三连星。金明完评曰,“黑棋左右阵势遥相呼应,而白棋14尖略缓,布局至此黑好”。


接下来,孤单的白18一子被黑棋猛攻。半途中,白32一着不慎,被黑棋强硬分断。


白棋两边都是苦战。结果黑71心慈手软,放白棋右边大块一条活路。若黑71改走A位尖,则局部白棋没有一个眼,非常危险。不过,即使黑棋放活白棋,仍然保持优势。


下边的战斗,黑棋计算精准,先手将白棋打成一条“光棍”,继续巩固优势。


最终樊麾眼看棋局不利,在左上角“玉碎”,AlphaGo再下一城。

最后一局,前面的部分略过不提,我们还是只说一个局部。


左上角的劫争,持续了十个回合。AlphaGo在过程中,找劫、应劫、判断得失,毫厘不爽。最终双方形成对等的转换,AlphaGo也保全胜利果实。有此劫争为先例,我不是很懂为什么在后来AlphaGo与李世乭对战期间,有那么多围观群众、棋迷、甚至棋手传播AlphaGo不会打劫的谣言。即使是上一代的AI,如Zen,应对单个的劫争,也不会犯大错。AlphaGo在此劫争中的表现,没有无谓地浪费劫材,也没有找损劫,表现出了比Zen高至少一个档次的实力。

AlphaGo赢了。五比零。这是历史上首次由人工智能在分先(平等)的棋份下战胜一位职业棋手,而且是完胜。2016年1月,介绍AlphaGo成果的论文登上《自然》杂志封面。这是对DeepMind团队取得阶段性成果的最好肯定。

成功并未丝毫影响DeepMind团队的判断力,他们对AlphaGo的实力有客观、清醒的认识。在论文《Mastering the Game of Go with Deep Neural Networks and Tree Search》中,参考樊麾职业二段(2p)的段位及8:2的总对战成绩,DeepMind团队将AlphaGo的实力评为职业五段,等级分3150分。从他们参考的等级分体系来看,3150分相当于中国的二线职业棋手水平。(参见谷歌围棋程序AlphaGo实力几何? – 知乎专栏)这与后来中国职业棋手对AlphaGo基于棋谱的实力评价基本一致。

当时,与李世乭的比赛时间已经敲定。想在几个月的时间里,让AlphaGo从一名平庸的职业棋手,成长为超越顶尖职业棋手的存在,并非易事。为此,哈萨比斯请回“手下败将”樊麾做AlphaGo的教练,为AlphaGo捉虫。人类与AlphaGo由对手变成了伙伴,这是第一次,在将来会变成常态。

历史性的一战,即将展开。

本文首发于知乎专栏——不一样的围棋,专栏地址——https://zhuanlan.zhihu.com/godifferent
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表