返回列表 发帖

AlphaGo与人类的恩怨情仇(5)-巅峰之战(上)

2018年1月21日   经典棋文

本文首发于知乎专栏——不一样的围棋,作者,不会功夫的潘达

2016年1月27日,AlphaGo登上《自然》封面。同日,DeepMind宣布,将在同年3月挑战韩国棋手李世乭九段。

李世乭,一代棋王,世界大赛十四冠(注1:DeepMind采用十八冠的说法,计入了亚洲杯电视快棋赛的冠军)。AlphaGo,第一个分先击败职业棋手的围棋AI。命运的齿轮就此开始转动。

人机大战,一个能抓住所有人眼球的话题。棋手和软件工程师,利益相关的两个群体针对人机大战争论不休,观点泾渭分明。IT从业者普遍对AlphaGo获胜前景乐观,因为AlphaGo采用的深度学习技术近年来攻无不克。而棋手们在看过AlphaGo对战樊麾的棋谱之后,认为她只不过是准职业水平。尽管从战胜樊麾到挑战李世乭,AlphaGo尚有五个月时间,但多数棋手不认为五个月的训练足以让AlphaGo跨越从弱职业到顶级棋手的天堑。两派观点都非常坚定,认为自己这边赢定了,却不知幕后的暗流涌动。

挑战赛的发布会上,李世乭九段表现出谨慎的乐观,认为自己将以5比0或4比1的比分胜出,重点是尽可能不要输掉一局。而DeepMind首席执行官哈萨比斯则表示,胜负将会是五五之数。纪录片《AlphaGo》揭示了哈萨比斯所说“五五开”的真实含义。

樊麾在与AlphaGo鏖战之后,回到DeepMind负责测试。3月份之前,AlphaGo飞速进步,表面实力已超过顶尖棋手。然而,樊麾在反复测试之后,发现了大问题。在少数局面下,AlphaGo不能正确评估当前形势,导致低级错误。


赛前的一盘测试棋,AlphaGo再次犯下低级错误。项目负责人大卫·席尔瓦(David Silver)在例会上说,如果正式比赛中出现这个错误,我们在公众面前就尴尬了。席尔瓦询问黄士杰博士有无办法解决,黄博士略带尴尬地笑称:“我正在努力解决。”

这确实不是一个简单的bug。直到出发前三天,整个团队仍在加班加点寻找解决方案,却无结果。哈萨比斯带领的团队,只能以有缺陷的AlphaGo出征了。

人们常说,李世乭面对的是一个冷冰冰的对手,无法与之交流心灵。不过,李世乭可以与哈萨比斯交心。赛前数日,哈萨比斯与李世乭通过翻译和视频交流。哈萨比斯曾是西洋棋神童,两人有共同话题。但李世乭最关心的事,当然是AlphaGo的实力到了何等地步。哈萨比斯称不能透露具体情况,不过AlphaGo确实已有长足进步,相信会是精彩的对决。


李世乭在与DeepMind签约之时,并未效仿“深蓝”故事,要求测试对局。大概当时李世乭并未意识到AlphaGo的巨大潜力。等到赛前,李世乭发现自己的对手深不可测,却再没有侦查的机会。李世乭为自己的轻率付出了代价,他只能在迷雾中作战了。

第一局

韩国首尔时间3月9日下午1时,巅峰对决启动。坐在李世乭对面的,不是机械手,而也是一位棋手。黄士杰,AlphaGo项目的最初开发者、主要贡献者,台湾业余6段棋手。黄博士安静、沉稳,符合大众对软件工程师的一贯印象,也符合一名棋手的形象。若不是黄博士面前有一台电脑,没人会怀疑这只是一场普通的围棋赛。


李世乭猜得黑棋先行。开局阶段,李世乭看上去比较轻松,落子不假思索。而AlphaGo则显得相当谨慎,每一步棋都思考了接近一分钟。棋局很快进入了不同寻常的方向。


全局的第7手,李世乭在棋盘右边斜拆四。黑棋1、3、5、7前四手的组合,在棋谱中不曾出现。李世乭或许是认为AlphaGo针对人类布局存有应对策略,便另辟蹊径,想考验对手。试探对手的代价是,这步棋本身不合棋理。按照一般布局理论,黑棋此时当在棋盘上边行棋,如A、B等处,避免左上一子孤军奋战。AlphaGo也持相同观点。


右上角简单处理之后,AlphaGo将黑棋上边二子隔开,取得了局部战斗的主动权。下到这里,李世乭慢了下来,棋局似乎不如预想的顺利。24、26又是令人惊艳的组合拳,各方解说无不赞叹AlphaGo的力量。落下第27手后,李世乭轻轻摇了摇头。李世乭有意要和AlphaGo掰掰手腕,但这不是最好的时机。被白棋28手切断以后,局部黑棋陷入被动。之后,黑棋勉强处理好被分割的两块棋,却免不了被对手占点便宜。棋至中盘,白棋已建立了一定优势。


由于棋局不利,李世乭表现得愈加紧张。第67手时,李世乭捻起一枚棋子,犹犹豫豫想落在A位,终究没有落下,讪讪地收回右手,摇了摇头。手持棋子在棋盘上晃来晃去,俗称“小猫钓鱼”。若是棋童这么下棋,要被老师打手心的。不过,若是李世乭确实落子在A位,事情会更糟糕,这盘棋李世乭就已经输了。在场的韩国解说称:“最令人担心的事发生了,李九段在怀疑自己,好像还有一点震恐。”

AlphaGo似乎已接近胜利,局面却又发生了变化。白棋把左下角广阔的空间让给黑棋,随后又弈出88虎的失着。黑91割下一子之后,将下方大空尽数收入囊中。


棋局至此,多数解说判断李世乭已逆转局面,取得优势。AlphaGo自评的即时胜率也略微下降,但仍在70%以上。就在各家媒体的演播厅的气氛一片乐观之时,AlphaGo祭出了决定性的一着。


白102,打入。光芒万丈的一手棋。白棋精确地撬开了右边黑棋防线上的唯一空隙。长考7分钟之后,李世乭并未找到歼灭入侵者的手段,无奈妥协。白棋金蝉脱壳,吃掉右上三枚黑子后扬长而去,确立胜势。

临近终局,解说们一遍又一遍地点目,只发现黑棋要输。在乐视演播厅,陈盈初段甚至不敢相信柯洁的判断,以为听错了。棋手们不愿意相信,李世乭也不愿意相信,但不得不接受事实。第186手之后,李世乭将一枚白子置于棋盘上,示意认输。欢呼雀跃的是AlphaGo团队,其他人则反复念叨一个词,“难以置信”。

首局比赛在全球有不少于八千万人收看直播,其中六千万来自中国。赛后,柯洁发微博说,“就算阿法狗战胜了李世石,但它赢不了我”。一石激起千层浪,数百万人由此认识了一位最年轻的世界第一。当年的柯洁还不是网红,也许他自己都没有预料到这条微博将产生的深远影响力。柯洁只是觉得,这一局AlphaGo表现出的水平不如自己。孟泰龄六段更为激进,认为他能让AlphaGo一先。由于AlphaGo的发挥看上去并不完美,棋手们在此时仍然低估了她。

本文首发于知乎专栏——不一样的围棋,专栏地址——https://zhuanlan.zhihu.com/godifferent

(弈客编辑YK009)
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表