返回列表 发帖

AlphaGo与人类的恩怨情仇(1)-世纪难题:灵感与汗水

2017年6月3日   棋艺探索


本文首发于知乎专栏——不一样的围棋,作者,不会功夫的潘达

漫画《棋魂》中,塔矢亮与进藤光初次见面时,不知天高地厚的小光要求与小亮分先对局。其时,小亮已经接近职业水平,而小光,甚至都没有下过一盘棋。小光所倚仗的,是一个真正的“鬼”才——佐为。棋盘上,虽然小光执棋子的手势和初学者一样,处于下风的却是小亮。小亮以为他只是遇到了一个普通的强大对手,直到小光落下这一手棋——


这时,小亮才发觉,他的对手是在高处俯视着自己。这不是一场同一重量级的战斗,这只是一盘指导棋。

在《棋魂》的这一话于《少年Jump》上刊载后17年,所有的职业棋手也感受到了小亮的绝望。这一次,俯瞰众生的鬼才换成了AlphaGo。

在李世乭以1:4的比分输给AlphaGo之后,多数人,包括很多职业棋手都认为,AlphaGo已经完成了对人类的超越,并且以AlphaGo强大的学习能力,李世乭很可能是最后一个曾经战胜AlphaGo的人。

这场人类与人工智能的漫长对决,是在此落下帷幕,还是余音绕梁,三日不绝?下文将展开论述我的观点。一家之言,欢迎讨论,不足之处也请各位多包涵。

一、灵感与汗水

围棋是世界上最复杂的游戏之一。所谓“一着不慎,满盘皆输”,每一步棋都可能左右全局的结果。一般来说,一手棋的决策分两步走。第一步,“搜寻”:凭经验或感觉给出几个候选的点;第二步,“判断”:分别对这几个点做形式判断,并进行比较。这两步,说来容易,但要做到笑傲众生的水平,对于天赋和勤勉的要求,不亚于一个优秀数学家所需要的。

刚学棋的小明第一次坐在棋盘前,不由得抓耳挠腮:棋盘这么大,第一步棋应该下在哪里。

学棋两年,小明的棋力已有小成。一次比赛,面对强手,小明祭出序盘“飞刀”。对手不假思索,按照常规思路行棋,不知不觉落入圈套。小明借此成功逆袭。

十年后,小明已贵为世界冠军。在一场重要比赛中,小明因形式不利而置大龙生死于不顾,以致其陷入绝境,似乎大龙已经必死无疑。在读秒声的催促下,小明竟灵光一现,在“不可能”的位置找到了己方大龙的唯一出路,成功逆转。

以上所述,是不同水平的棋手在棋盘上面对的“搜寻”情景。从初学者成长为职业棋手,需要先学会基本的布局理论、掌握基本的死活、对杀常识,然后熟记数百个定式及掌握其主要分支(飞刀)、练习数万死活题,同时在大量对局中磨练。有些外行据此认为,围棋只是复杂一点的“体力劳动”。对于这一观点,下图小明同学白1这一招抵得上千言万语。


图中右上的形状,在任何一本死活题的书中都不曾出现。实战白棋这一招的位置,也属于一般“搜寻”思路下的盲点。但小明同学在短时间内看到了这一招,一举扭转乾坤。

“体力劳动”让天赋平平者能够成为业余高手,但山巅最美的风景只属于天才。

我们再说“判断”。判断很难吗?在中国象棋或者国际象棋中,形势判断对于程序来说并非难事:只需观察双方子力的差距就可以大致判断出形式的好坏。当年战胜卡斯帕罗夫的“深蓝”,其形式判断算法大致就是如此,非常简洁。而围棋的形势判断是个真正的难题。围棋的胜负由终局时双方控制地盘的多寡决定。然而棋局进行到一半,双方的地盘都尚未封闭,怎么判断形势呢?

职业棋手采用的算法是估算双方的目数(地盘大小)差距。那如果地盘的边界没有完全确定怎么办呢?如果有先手官子就判给先手方,如果是双方后手官子就算一人一半。如果有一些模糊的地方,比如说一块厚势折算成几目呢?这时候就只能凭经验感觉了。职业棋手之间微妙的水平差异,很多时候也体现在模糊判断能力上。


对于如图所示的中盘阶段末期的局面,职业棋手一般能在一到两分钟内大致判断出双方地盘的差距,并据此决定接下来的策略是保守或是激进。这样的判断速度和准确度,和“搜索”能力的训练一样,背后也是数千盘对局积累下来的经验。

不过,“数地盘”式的判断也常有失灵之时。除了模糊判断可能带来的误差以外,对于某一块地盘归属的错判也是经常发生的。李世乭-AlphaGo五番棋第一局中,职业棋手们就在局中集体给我们演示了一次这样的错判。


这是棋局进行到第101手时的局面。李世乭在棋盘上落下的这一手确保了右上黑棋的安全。由于AlphaGo在左下步伐紊乱,黑棋收获颇丰。沉浸在乐观情绪中的职业棋手们一致判断黑棋明显优势。直观上来看,此局面的判断并不复杂:黑方下边一块确定的目数,基本可以和白方全局确定的目数+厚味抗衡;黑方额外多出右边红框里的地盘,意味着黑棋盘面(即不计贴目)领先15目左右。然而,当时没有人想到,右边红框范围内看上去已经万无一失属于黑棋的地盘,即将被AlphaGo掏空。

敏锐如柯洁者,第一时间看到了白棋在R10(图中绿圈)打入的手段。不过,柯洁当时的说法是,这是落后一方孤注一掷的手法。局后回顾,才发现此处黑棋已无法全身而退,而AlphaGo对此早已成竹在胸。从DeepMind公布的数据来看,AlphaGo认为此局面下白方的胜率超过75%,这意味着AlphaGo对R10打入之后的变化充满信心。棋局的走向证明了AlphaGo判断的正确,而职业棋手的直觉在此处集体失灵。

那么,AlphaGo凭什么认为自己有75%胜率呢?我们在下一节讨论围棋程序如何进行“搜寻”和“判断”。

本文首发于知乎专栏——不一样的围棋,专栏地址——https://zhuanlan.zhihu.com/godifferent
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表