返回列表 发帖

观棋观人忆往事:神之一手与围棋的新时代

本帖最后由 天马行空 于 2018-12-28 08:42 编辑

原创: 庆丰棋圣木可三吉  3月14日

观棋观人忆往事:神之一手与围棋的新时代 —— 写在李世石与AlphaGo的人机大战两周年之际




如果不算樊麾与AlphaGo(阿尔法狗)不公开进行的对局,被冠以“围棋人机大战”名号的正式比赛只有两次——2016年3月AlphaGo与李世石在韩国的五番棋大战,以及2017年5月AlphaGo与柯洁在中国的三番棋、与周睿羊等五位世界冠军的一对多和表演赛性质的配对赛AlphaGo+古力对AlphaGo+连笑,总共也是五盘棋。

无论是对围棋领域的影响,还是对人工智能领域的影响和科学意义,又或是论及广泛的传播性和带给公众的震撼,均是第一次人机大战(即AlphaGo vs 李世石)的五番棋更大。

不知不觉中,第一次人机大战已经过去两年整了。今天是2018年3月13日,两年前的今天,2016年3月13日,李世石在人机大战的第四局以被后来报道为“神之一手”的一挖,引发AlphaGo出错,获得宝贵的一胜。这也是人类棋手面对AlphaGo在正式比赛中取得的唯一一胜(不含配对赛)。

李世石曾经在比赛后这样谈及这盘棋的胜利:“这里要向我的朋友古力说声抱歉,本来我以前认为我和他的十番棋是我一生中最重要的对局,但现在,我要改口了。(对AlphaGo第四局的)这盘棋获胜是我棋士生涯中最宝贵的胜利,用什么都不换。”


当李世石从对局时走出来后,现场的所有人包括研发AlphaGo的DeepMind团队成员都对他表示祝贺,前几天一直气氛压抑的记者会现场掌声雷动,韩国棋院的嘉宾们脸上洋溢着喜悦的笑容。远在中国的职业高手们也如释重负地微笑着讨论这盘棋的戏剧性进程。

尽管五盘棋过后,李世石还是以1胜4负的成绩输掉了这次人机大战,AlphaGo的实力也被证实,以机器学习技术突破计算机围棋的思路是正确的,但李世石并不是这次人机大战的失败者,韩国媒体和围棋爱好者们把李世石视为“英雄”,也在韩国掀起了学习围棋的新热潮。

李世石赢下的这第四局,其价值并没有因时间的推移而贬损。正相反,随着人工智能越来越强大,AlphaGo的漏洞逐渐隐去,凭着现今人类棋手的棋力已无法赢下任何一盘棋,李世石的那次胜利也就成了绝无仅有的一胜,因而越发宝贵,具有历史意义。在以后写成的任何一本介绍围棋发展史的书籍中,李世石的这一胜都不可能被忽略,而且要大讲特讲反复讲。每一位想要学习围棋的小棋手都会从老师那里听到关于这一局的故事。围棋职业选手在学习过程中,一定会打这一局的谱。李世石的名字也将因为这么具有传奇性的一胜而更加带有传奇色彩。


我们来回顾一下第一次人机大战的过程和AlphaGo vs 李世石的五盘棋。

计算机下围棋被认为是比计算机下国际象棋更难的一个挑战,因为围棋的变化远比国际象棋多得多,而且围棋的局面判断比国际象棋复杂得多。在国际象棋被计算机征服后,近二十年里,计算机科学与工程专家一直希望能够把围棋当做下一个取得突破的方向。然而,尽管计算机的性能有着日新月异的进步,却依然与完全计算围棋变化的目标有着遥远的距离。

在蒙特卡洛树搜索的算法出现后,顶尖的计算机围棋程序可以达到业余中等水平,与职业顶尖棋手的水平不可相提并论,只是让五子六子的程度。

直到2015年底,DeepMind的论文发表在《Nature》之前,仍没有多少人相信围棋会在短期内被计算机攻克。


而事实上,在2015年10月,可以被称为“围棋人工智能”的新一代计算机围棋程序AlphaGo已经战胜了欧洲围棋冠军、旅法的中国职业棋手樊麾二段。樊麾事后回忆,在连战连败之后,他已经有点怀疑人生了,可是因为要保密,对谁都不能说,也没人可以帮他排解心中的郁闷。

DeepMind把关于AlphaGo技术的论文发表在《Nature》上,公开可阅读的时间是2016年1月底。

深度学习?监督学习?强化学习?机器学习?人工智能?这都是什么?围棋界无人理解AlphaGo所采用的技术,自然也根本不相信几个月前还被自己让五六个子的计算机会突然具备与职业高手抗衡的能力。要知道,棋手的进步是循序渐进的,从让五个到分先下,这之间的差距太大了。


DeepMind为了证明自己研发的围棋人工智能很好很强大,直接联系到了韩国的传奇棋手——李世石。既然棋界认为樊麾的水平不能说明问题,那就直接叫最好的棋手来下。2016年1月初,李世石刚刚与当时排名世界第一的柯洁下了梦百合决赛五番棋,2-3惜败,最后一盘决胜局差距只在毫厘间,可以认为李世石仍处在职业棋界的顶层。根据GoRatings的排名,那时李世石排在第三。尽管柯洁也被列入候选,如果李世石不答应,DeepMind就会询问柯洁的意思,但李世石的名气更大,当时柯洁还远没有现在的名气这么大。结果李世石一听,连五分钟都没用,就同意接受这次挑战。

整个围棋界已经很多年没有遇到这么具有新闻关注度的事件了。比赛地点设在韩国首尔的四季酒店。来自英美韩日中等各国媒体的报道团队齐聚,热度未战先起。对比赛结果的预测呈现两边倒的有趣状况——计算机领域的专家一致认定AlphaGo大胜;围棋领域的专业人士一致认定李世石连一盘恐怕都不会输,更别提总比分输掉了,不可能的。


比赛进行期间,国内的各大网络媒体纷纷找职业棋手做直播嘉宾点评讲解,央视在重要时段插播比赛的实时情况和评论,一时间,有空闲、会讲棋的职业棋手成了被争抢的香饽饽,简直前所未有。与人机大战日期重叠的职业棋战根本没人关注,棋界的所有目光都投向了这次人机大战。

代替AlphaGo落子的是黄世杰博士,他本人是围棋业余好手,也是研究团队的重要成员。计算机围棋比赛多采用中国规则,相当于贴7目半,这次的人机大战也不例外,每方2小时保留时间,3次1分钟读秒,这个用时与“三星杯”差不多。获胜方奖金100万美元,李世石有15万美元的出场费,胜1局可获2万美元奖金。不少棋手开玩笑说,这是DeepMind给李世石送退休金和奶粉钱来了,这么丰厚的奖金绝对是围棋比赛的纪录了,很长时间都不会有超过这一数额的奖金。言外之意,李世石将轻松获胜。


【第一局】(2016年3月9日)

这一天具有历史意义,人工智能AlphaGo亮相即证明了自己的实力,DeepMind团队兴奋不已,证明他们走在了正确的路上,做出了划时代的突破性成果;可是围棋界却被惊呆了,李世石竟然输掉了这盘棋,一盘完败之局,怎么可能?!

执黑的李世石在布局阶段抱着想试一试机器会不会下的心态,故意走了个自己也没怎么研究过的奇怪布局。按照棋界的老套想法,计算机肯定是输入了很多人类棋谱,有一个数据库的,以前见过的,机器会下,以前没见过的,机器可能就不会下。殊不知,AlphaGo的算法根本就不是这么回事,老眼光看新问题要吃大亏,也没几个棋手认真看或看得懂DeepMind的那篇论文,隔行如隔山。

根据事后的复盘研究,从第一个局部战斗,AlphaGo就取得了优势,之后无论是掌控局面的能力,还是对局部棋形的敏锐,AlphaGo都远远超出以往任何一个计算机围棋的表现,令人类棋手中的佼佼者也难以招架。


赛后,很多职业棋手的第一反应就是不服,还有一些怀疑李世石与DeepMind有秘密协议不打劫什么的,更有“看棋高三段”的棋手批评李世石下得臭,“换我去下肯定能赢”、甚至有说能让AlphaGo两个子、四个子的。这些评价如今看来显得有些滑稽,但放在当时那个背景和氛围下,也可以被理解为是一时情绪激动和观念没转过来所致。

也是在这一天,柯洁发出了这样的豪言:“就算阿法狗战胜了李世石,但它赢不了我”。这句话收到了三万转发和七万个赞。他还介绍了自己的围棋成就——世界第一人、8:2李世石、这个年纪世界冠军拿了三次前无古人。这个介绍也获得近五万转发和七万余个赞。由此,柯洁从棋界知名一下子走红网络,在更大范围内获得了知名度,中国围棋出了一位明星棋手。当时他的网名还叫“柯洁大棋渣”!


现在柯洁的网名已经变成了“棋士柯洁”。



【第二局】(2016年3月10日)

本局李世石执白,意识到对手的强劲后,小李使用了中规中矩的布局,而AlphaGo面对最基本的托退定式居然先刺损变化的下法,又令观战的职业棋手们纷纷乐观起来了。

随后,AlphaGo居然又下出了五路肩冲的惊人一手。这绝对不是从人类棋手的棋谱中套用来的,人类棋手不会下这种被公认是损实地的棋。这说明,AlphaGo的围棋具有与人类不同的思路,而且有创造性。

接下来的短兵相接和缠斗,担任讲解的职业棋手普遍觉得李世石优势,AlphaGo勉强。可是随着定型收官的进程,大家一数目,咦,怎么是李世石目数不够?在中腹一虎之后,李世石的形势已经明显不乐观了。

最后的收官阶段,担任某平台讲解的陈耀烨九段素以擅长官子闻名,他也要赞叹AlphaGo犀利的收官搜刮手法,表示自己要向AlphaGo学习。


这一局李世石又输了。不仅他自己背负着巨大的压力,忧心忡忡的韩国棋院也想帮他出谋划策。李世石选择了趁着休息一天精心准备第三局的布局。中国围棋界也因为李世石的两连败而倍感压抑,一些不好的猜测也成了部分棋手排解抑郁的宣泄口。两年以后再看当时的那些质疑,未免有些让人哭笑不得。

毋庸讳言,那时候不到19岁的柯洁年轻气盛,有些话是欠妥的(两年过去了,如今变成熟的柯洁不太可能再说这样的话了,人都是在成长的。2016年时,他还缺乏在媒体面前和公开平台讲话的经验。过去的就过去了,本文引用这些,只是为了从其他人的角度看第一次人机大战,并非为了翻旧账黑谁一把)。尽管他随后又发文解释——“不是说怀疑他签了保密协议里有不准打劫这一条,是对李世石的消极抵抗感到失望”,但是从语文的角度看,难道下面这段发言还有其他的意思吗?


但这也不是柯洁一个人的怀疑,除了柯洁在文中提到的“提出不礼貌问题”的“我非常熟悉的一个记者朋友”明知不礼貌还要“敬业”地提这样不礼貌的问题,还有很多职业棋手,比如俞斌总教练就公开谈论并怀疑过李世石与AlphaGo团队有不打劫协议,然后还用他所理解的十几年前的计算机围棋理论来解释AlphaGo的算法和理念。业界前辈的看法或许影响到了柯洁,让他不觉得发这样一段文字有何不妥,而当成是直率的实话实说。

柯洁还在当晚写了评论,“如翔在喉”这个用词代表了他对李世石第二局表现的极度不满。这自然也是有情绪的气话。

不过,柯洁的这个看法同样并不是只有他自己这么想。韩国棋界当时是什么看法,我们不了解,但中国棋界在那时有多位知名棋手认为李世石下得太臭,而AlphaGo下得其实并不见得怎么好。可以翻看当时的一些直播视频为证。

李喆在那时则发了一篇文章称李世石已经做得很好了,设身处地,没有人会比李世石做得更好。这篇文章被柯洁在随后的直播中吐槽,认为该文章胡扯,怎么就没人比李世石做得好呢?

同在一起直播的科尔沁夫不知道是否清楚该文章是李喆写的,他毫不掩饰地嘲笑这篇文章瞎扯淡,写这篇文章的人不懂围棋。嗯,听起来蛮有意思的,这话如果是柯洁说,也就罢了。科尔沁夫说李喆不懂围棋。


当然,半年之后,觉得AlphaGo下得并不怎么好的棋手已经寥寥无几了。

而如今,认为把自己放到李世石两年前的相同处境能跟AlphaGo对抗不落下风的棋手就更少见了,顶多是觉得“现在各种AI见得多了,我跟绝艺、金毛、里拉、地震谈笑风生,再与AlphaGo Lee下,会比李世石发挥得好”。

第一个在正式比赛中面对人工智能的棋手总是很难做的。

假如没有AlphaGo的论文为基础,没有之后经过一年多的研发,诸多后来者跟随AlphaGo的脚步蓬勃发展,没有那么多AI整天放在网络对弈平台上让我们练手,只有一篇《Nature》的论文和与樊麾对弈的棋谱作参考资料,我们上去就跟AlphaGo下,会死得好看一点吗?——这是一个设身处地类型的问题。


【第三局】(2016年3月12日)

再输一局的话,100万美元的奖金就泡汤了,五番棋也等于输掉了。李世石没有这样的心理准备,所有围棋界的人也没有这样的心理准备,难道真要连一局都赢不了就认个3-0的惨败吗?人类棋手这千百年的积累在人工智能面前变得毫无价值了吗?

利用一天的休息时间,李世石与朋友精心研究并制定了策略,也决心要打劫试一试AlphaGo。

执黑的李世石以备好的布局出战,下出了积极拼搏的攻击气势,然而AlphaGo只用了寥寥数招就化解了李世石的攻势,其中一手象步跳令人赞叹。这一局AlphaGo的优势来得更早、也更轻松,展现了一种让职业高手们内心惊骇的强大境界,这是以往任何一位高手都不曾达到的传说中的境界——你来吧,你越发力,输得越惨,我不跟你争,不跟你抢,都让你走到,然后你还是输。不战而屈人之兵,你还怎么下?

这盘棋是让任何棋手都找不出什么机会的完胜之局。AlphaGo在最后还展示了一回打劫的能力,让质疑声灰飞烟灭。李世石的拼搏是顽强的,也是悲壮的。


看了这盘棋,每一位职业棋手的头顶上都像压了一块巨石。即便是与李世石没有任何亲情或友情关系的棋手,也为他感到难过,也对自己追求的棋理和棋道产生了怀疑。柯洁在直播讲解时也承认,让自己去下,必须得前面发挥完美,后面才差不多有一半的机会。

全程观看了第三局,柯洁意识到,自己与AlphaGo终有一战。他也明白,即便是马上与这个版本的AlphaGo下,他的机会也不多。这从当时发文的语气与前两天的反差就能看出来。棋界的普遍看法也差不多,人类顶尖棋手已经弱于AlphaGo了。


大部分棋手从这盘棋开始理解李世石的艰难了,不再认为是李世石下得臭才输棋了。(事实上,围棋对弈有一个很基本的道理——对手的水平越高,才显出咱们下得不好;如果对手换成那谁谁,就凭咱的棋力,那还不是各种手劲眼花缭乱,下得漂漂亮亮,满盘尽显高手风范?现在我们经常看网络平台上,高水平AI与高手下棋,人类棋手一个不留神七八十手就死大龙,百手以内败局已定的情况屡见不鲜,你说这是棋手臭还是AI高?这都已经是天天见了,没有什么不适应不熟悉的问题,尚且如此。到了第二次人机大战,AlphaGo晋升为Master,无论是柯洁的第一局和第三局,还是五位世界冠军组队与AlphaGo的那一战,都是五十手之内败象显露,这怎么评价?总不可能大家都是臭棋篓子吧。)

旁观者望AlphaGo之高棋而胆寒,那么身为对局者的李世石的心情又如何呢?绝望了吗?


【第四局】(2016年3月13日)

前三局一盘未胜,从赛前的大乐观变成现在的大悲观。棋界的风头由“李世石一盘都输不了”一百八十度大转弯成“李世石一盘都赢不了”。旁观者尚且如此沮丧,身处漩涡中心的李世石的心情又是如何呢?换成一个心理素质稍微差一点的棋手,此时早就崩溃了。

第三局与第四局之间没有休息日。根据李世石的夫人赛后接受采访时所述,李世石当晚回到家,默默研究棋局,不断地抽烟,气氛凝重,但李世石没有被击垮心态。

如果是一般的五番棋对局,一方连输三盘,第四盘、第五盘就没必要下了。但这次的五番棋比较特殊,DeepMind为了验证AlphaGo是否有BUG,坚持要下满五局,不论结果如何。这个设想早就在洽谈初期便得到李世石的赞同。估计当时DeepMind还是担心AlphaGo前三局表现不佳吧。

从第四局起,李世石的目标就变成了争取一胜。即便是这个目标,也没什么人看好他。


布局阶段,AlphaGo下得十分出色,而且频出新招,李世石的白棋应对艰难。不但棋局不利,李世石的用时也很紧张。转播画面中全神贯注思考的小李迎来自己的第四败似乎已是必然。

第78手,白棋的一“挖”,绝境中求生。局部棋形,这是一个要点。观战者看到这手棋也赶紧埋头摆变化。经过一番演算,尽管这手棋颇有妙味,但理论上,只要黑棋应对得当,仍然是黑棋的好局。

结果AlphaGo这时出错了,而且是接连出错,最后死了一块又乱下。李世石在胜利接近时,沉着冷静,稳稳守住胜果。


这一胜,打破了AlphaGo不可战胜的神话,让棋界欢欣鼓舞,人们发现原来AlphaGo也不是完美的,人类的围棋还有其价值和妙处。李世石称这是自己围棋生涯中最宝贵的一胜。两年后的今天,我们都明白,这也是人类棋手对AlphaGo的唯一一胜,绝无仅有。

“神之一手”是人们后来称呼第78手的用词。单纯从围棋的技术判断,这手棋不是绝对有效的。但在当时的对局时,它是李世石精湛的围棋技术、敏锐的嗅觉和强悍的意志力,再加上一些运气,所有这些凝聚为一招落在棋盘上,就是“神之一手”。

李世石赢下这局,如释重负,脸上露出笑容。


不只是李世石,围棋界的高手们也为这一胜而高兴。



【第五局】(2016年3月15日)

自从第四局赢了之后,李世石的心情一下子轻松了。如果是在这次人机大战之前,有人问李世石,你如果只能赢一盘,心情如何?李世石大概会说,那一定糟糕透了,不过怎么可能?世易时移,现在所有人都知道AlphaGo有多强了。

但是有第四局打底,职业高手对AlphaGo的信心恢复了不少,至少赢过一局,觉得能下了。李世石在第五局主动要求执黑,因为他执白赢了一局,想再执黑赢一局。大家都知道,大贴目规则下,执黑是比较难下的。李世石却不在乎。只有像他这样心高气傲的棋手,才会在此时主动要求执黑。


这盘棋对之后一年的职业棋界布局有极为深刻的影响。托退定式+无忧角被碰之后怎么办,这个经常在人类高手对局中出现的布局套路,经过AlphaGo本局下法的启发,有了新的理解。这一布局的各种衍变甚至牵涉到了布局理论的若干根本问题。

最终,这盘棋的结果是李世石小负。AlphaGo在右下角本来下得很出色的地方,中途却突然有算错死活损目的嫌疑,多亏了后面出色大局观才重获领先。


第一次人机大战的五盘棋不仅内容有趣,过程精彩,期间比赛棋手、旁观棋手和普通棋迷们几经起伏的心理变化也颇值得回味。人对于新鲜事物,尤其是先进的、跨越式发展的新鲜事物,接受的过程是有快有慢的。有人很快接受了,有人从不信到笃信,有人持怀疑论不放,有人固执不接受。

而能够在历史关键节点上担当重要角色并留下光彩一笔的人,无疑是能力、机遇和运气兼备的传奇。

李世石在第四局获胜,让他的传奇之名更添传奇色彩。

很多人意识到,从这以后,围棋的发展进入了一个全新的时代。与历史上几次由卓越的人类围棋天才引领不同,这一次围棋理论和技术的进步是由人工智能引领的。AlphaGo展现的是领先目前人类围棋很多年的新境界。


而第一次人机大战中AlphaGo的若干缺陷也成为DeepMind改进和突破的契机,并为第二次人机大战AlphaGo vs 柯洁预留了伏笔。柯洁在那时的求战欲望也很强烈,也由于李世石第四局的胜利而受到鼓舞,不太信服AlphaGo的实力能高过自己太多。

AlphaGo的BUG给顶尖高手们带来了“我也能赢”的信心,此时,棋界并没有几个人预见到,仅仅过了不到9个月,一个更高级的AlphaGo将会登场,强大和稳定的程度足以让任何顶尖高手用任何套路策略都毫无胜机。


(写于第一次人机大战李世石以“神之一手”迎来唯一一胜两周年 - 2018.3.13)
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表