如何评价第二局比赛 AlphaGo 又一次战胜李世石？

本帖最后由天马行空于 2016-7-20 14:40 编辑

来源：知乎　高飞龙，雕翎不腐，鼎镬不锈。　2016-07-15

这局有哪些精彩之处，两局对比有何变化，接下来李世石将如何调整应对？

　　最近两天几乎每一个小时都有新的认识，学到了很多东西。
　　今天我的认识可能与昨天不同，而明天又将比今天更进步。

　　所以本答，仅代表我在第二局比赛结束并休息一日后的认识。
　　同时，本答将致力于让更多的人，甚至是让完全不懂棋的人看懂概要。

　　-
　　先说最重要的事：
　　第二局比赛中，李世石的表现和AlphaGo的表现都比第一局更强，而绝大多数人（包括大部分围棋界的人士甚至包括一部分人工智能界的人士），对AlphaGo的实力判断提高了一大截。
　　AlphaGo展现出了至少不亚于人类最顶尖棋手的前半盘实力，后半盘的收束水平甚至可以说已经明显高于所有人类棋手。
　　部分人类棋手认为李世石前半盘有机会而后半盘全线落后，而更多的人类棋手却认为李世石完败。
　　而听说AlphaGo好像并不认为自己始终占优。

　　-
　　第一场比赛结束后，很多人的情绪都很低落，“哀鸿遍野”的情绪持续了大概几个小时。毕竟大家虽然都知道这一天早晚会来，但没想到这么快，这么突然。
但没过多久，大量的职业高手们就缓过神来，开始了严肃的复盘和反思。

　　当天晚上十二点，李喆六段在自己的公众号中发布了一篇意义重大的文章：
　　【火线速递】——李世石的策略与AlphaGo的弱点
　　这篇文章非常理性客观的分析了李世石和AlphaGo在第一局中的发挥、李世石采取的策略、AlphaGo为什么会下出有争议下法的可能原因、以及AlphaGo可能存在的问题。

　　这篇文章是迄今为止我看到的，对第一局比赛最好的分析，给了包括我在内的大家很大的启发。
　　甚至可以说，这篇文章很可能是所有人类距离AlphaGo第一局为什么获胜的，最接近真相的分析。
　　在这篇文章面前，我在如何评价第一局比赛 AlphaGo 战胜李世石？ - 高飞龙的回答的有关棋局的分析，显得认识过于肤浅。

　　-
　　首先，需要再次强调的是，AlphaGo选择落子位置的决策，是以之后下法的获胜概率为导向的。
　　AlphaGo倾向于选择获胜概率最高的下法，并且时时刻刻都对当前局势有一个自身获胜概率的判断，也就相当于人类的全局形势判断。

　　一个有趣的现象是，根据尚未彻底确定的消息，在第一局中，AlphaGo对于自身获胜概率的判断始终高于50%；而在第二局中，AlphaGo前半盘对获胜概率的判断一直为接近50%，甚至在中盘一度低于50%，而很快又提升到50%以上，并越来越高。
　　而与此对应的是，在即时性的直播中，大量人类的高手们对形势的判断大致是：
　　第一局开局AlphaGo占优，中盘李世石占优，后半盘AlphaGo翻盘。
　　第二局，部分人认为AlphaGo始终占优，而李世石完败；另一部分人认为李世石前半盘占优，中盘太缓而被翻盘。

　　为什么会出现这么有趣的差别呢？
　　首先，我们要拐回头从第一局开始看。

　　首先当黑79在左下挂角时，白80脱先补上方的“缓手”，这步棋一定是缓手吗？
　　根据李喆的意见，如果白棋按照普通的下法回应左下黑棋的拐角，黑棋接下来可能：

　　黑棋在左上动出的手段相当的严厉，后续变化非常复杂。
　　当然，白棋未必害怕这样的手段，从一部分人类高手的经验来说，很可能会选择这样的战斗。
　　而AlphaGo这两天的棋，有着这样的风格：在局面不差或占优时走最简明的棋，不喜欢保留变化。
　　所以我们可以大致依此推测，它依据自身的决策模型，很可能会认为上图的下法因变化分支过多而难以掌控，故而获胜概率较低。

　　那它为什么会判断实战的下法获胜概率更高呢？我们继续往下看：

　　实战白A一步的“自创新招”，最终下成了局部这样的变化，大家可以看到黑棋在棋盘的左下中部形成了一块大空，而这空凭空出现，可以说是白棋白送给黑棋的，所以可以说局部大损。
　　从前面白80的“缓手”，到这里的大损，AlphaGo始终判断自己全局的胜率较高，即全局占优。
　　而当时大多数人都认为白棋不好。

　　这是由于大多数人对后续下法导致的后果出现了误判或者忽略。
　　这里做一个科普：什么是形势判断？
　　形势判断并不仅仅是对棋盘上已有的棋子形成的局势的判断，而是依据现有棋型，对各个局部将来可能形成的最终定型进行预判，并且对预判形成后的全局棋型进行点目，最终判断局势。
　　所以懂棋的人都知道，形势判断是各方面技术达到很高的水平之后才能掌握的，并且水平越高、计算力越强，判断也就越精准。

　　AlphaGo在这里仍然判断自己形势有利，是因为它判断当自己抢到先手后，会在右边下出如下手段并取得很大的便宜：

　　白102点入，当时被认为是白棋在形势不好时释放的胜负手，最终的结果大家都知道，白棋在对外围损伤较小的情况下，吃住了右上黑棋三个子（圆圈）。
　　此处战斗结束后，黑棋大损，一部分人类高手认为白棋就此“翻盘”，当然还有少部分人认为白棋只是“扳回”了均势。

　　实际上这很可能根本不是什么“翻盘”，被人类高手誉为绝妙手筋的白102也根本不是什么“胜负手”。
　　白102只是AlphaGo一早就已经发现了的手段，认为这是自己的“权利”，并且它将右上最终的战果（吃住黑棋三子）很早就考虑进了全局形势判断，所以它才会始终认为自己占优。
　　而人类高手未必就不能提早判断出这些，如果是一名人类棋手在局中提前做出了这种判断，大家可能会对他的表现表示由衷的钦佩，但未必惊为天人。

　　而当时AlphaGo与李世石弈第一局时，可能没有人预想到AlphaGo会有这么强（知道谷歌内部计算出的AlphaGo的等级分的人也许知道它很强，但未必能想象出这样的表现）。
　　但事后，我们既然知道AlphaGo始终认为自己占优，那么它一早就算清了这里的变化并考虑进入了全局形势判断，就不再是一个高估它的”猜想“，而很可能是它棋力强劲的真实表现。

　　那么为什么AlphaGo要在左下角选择那么亏损的变化呢？
　　很多知道算法的人都已经分析过，AlphaGo会在80%赢10目和70%赢20目之中，选择前者。
　　也就是宁可用局部损目来换取全局赢棋的可能性。
　　有些人还说，这与人类的思路完全不同，因为人类喜欢在局部算目数的亏损，而积小成多最终汇集成胜局。

　　且不论其是否具有绝对合理性，AlphaGo采用的是这种“用目数换概率”的决策方式，我们应该都已经没有疑问了。但后面那种对人类思路的理解，明显出于不太懂棋的人之口。
　　人类，很多时候一样有这样的思路。
　　首先，前半盘“弃子取势”等虚路棋的概念，就是以目换概率，只不过人类喜欢将其大致换算成目——自己容易理解和互相之间易于沟通传达的概念。
　　而后半盘的收束中，很多高手会在优势时“快速收兵”、“缩小棋盘”，经常以局部损空的方法来减少棋盘上剩余的空间，来逼近终点。

　　这后一种情况，现在来看，极有可能正是AlphaGo在第一局中的左下角所做的事情。
　　如果AlphaGo直接在右边动手将自己的“权利”兑现，那么在棋盘左下方的开放性空间中，黑棋肯定会拼命，甚至拼命追杀左下角以求换取更大利益。
　　这样，AlphaGo冒的风险更大，获胜概率可能较小。
　　而实战AlphaGo先将左下定型之后，再兑现右边“权利”，黑棋虽然发现左下占了便宜，可算上右边吃的亏，全局是落后的。
　　而且，左下定型后，黑棋没有施展手脚的空间了。
　　AlphaGo获胜的概率的确提高了，正如它自己一直认为的那样。

　　实际上，先定型再兑现权利，用自己判断的领先战胜对手的方式，在人类的高水平对局中在所多有。
　　但当左下棋盘还如此空旷时就早早判断出要赢，收兵定型如此早的例子，我一时能想起来的真不多。
　　仔细回想打过的棋谱，经常干出这种事并被大家赞誉不已的人类棋手，猛一下能想起来的只有吴清源和李昌镐。
　　他们总是能在大家都觉得棋局还不明朗时，就判断出“这样下已经赢了”，并开始不惜用局部损目的简明手法定型来缩小棋盘、逼近最终胜利，而当对手判断清时，早已为时已晚。

　　AlphaGo第一局跟李世石对弈时，还是被大家低估了。

　　-
　　接下来，看看昨天的第二局。

　　且不提开局AlphaGo在右上惊艳的五路肩冲到底是好是坏，它始终认为局势是均势。
　　（有人赛后问我为什么说这步棋人类“绝不会下”，实际上从来没有什么人类“绝不会下”的棋，这手棋跟当年武宫正树的肩冲星位也有异曲同工之处）
　　而当序盘战斗中，AlphaGo在左下走出了一系列的疑问手之后，大家都认为其局部严重亏损，而且此时局面尚早（开放），AlphaGo也没有取得优势，完全不能理解它这种下法是在“以目换概率”。

　　围棋是抢空（地盘）的博弈，单个棋子能占据或者控制的空的数量（目），被称为这个棋子的效率（子效）。而全局子效高的一方，自然就占优并且获胜概率较高，这是非常明晰的逻辑。

　　左下黑棋这一团子（圆圈），完全是一堆凝型，堆积在一起，不仅没有目，棋子的效率极低。
　　而且还是飘在天上的孤棋，将来可能成为负担，而两侧的白棋却都是活棋并且棋型完整。
　　所以黑棋在局部战斗中，将开始尚有少许毛病的白棋阵营变成这种棋型，无论如何都没有任何好的道理。
　　（什么这个棋是外势啦其实不亏啦的各种说法显然是不怎么会下棋的人说出来的，不值得讨论）

　　这就是棋理所在，当然所有人也都认为这么下不好。
　　据悉，在此局中，AlphaGo开局以来一直认为获胜概率是50%，而当这个局部战斗之后将获胜概率判断调整到了50%以下......
　　这很可能是两盘棋中，李世石唯一的真正占优的时刻。
　　虽然这优势可能也很小。

　　但好景不长，不知道李世石是因为第一局输了过于谨慎，还是认为此处占了便宜而马上变的保守，他立刻下出了一系列的缓手，而AlphaGo立刻抓住机会反超局面并且拉开了差距。
　　短暂的一瞬间的微弱领先之后，李世石再也没有了机会，后面的局势完全是AlphaGo碾压。

　　AlphaGo的黑棋63贴时，白64跟着下很有疑问，当场就被很多人认为是缓手，应该打入上方黑空。
　　而AlphaGo立刻按实战的下法将右上的阵营牢牢守住，白棋的机会转瞬即逝。
　　哪怕不懂棋的人也应该能看出来，红线标明的两堵白墙，中间的间隔非常的近。
　　你家盖房子两堵墙之间只隔一米，喘的过来气儿吗？
　　子的效率能高吗？

　　如果这个还不明显，我们再看看接下来李世石疑似的最终败着：

　　白68到底缓不缓且不论，白68和黑69的交换白棋到底亏不亏也不说。
　　白70、72打拔二路一子，还落了后手，几乎等于投降。
　　当时在直播或研究的所有人，感觉都要跳起来了。
　　李世石是怎么啦？

　　看右上角，画了圆圈的以及71位的共七个黑子（被提掉了一个）围成了大圆圈的地盘，和画了圆圈的以及70、72位的共九个白子围成了小圆圈的地盘，大家比较一下。
　　我七个子围了这么多（基本围住，角上有小毛病），你九个子围了这么少。
　　谁的棋子效率高？
　　你还想跟我争胜？

　　大圆圈和小圆圈，哪怕一点都不懂围棋的人，到这里也能看懂了吧。
　　白70、72打拔这两步超级缓手，直接在局面并不领先的时候让出了先手，而AlphaGo马上补强左下那一串孤棋，之后再也没有给李世石机会。
　　据悉，AlphaGo在白70、72之后，立刻将自己获胜的概率提高到了高于50%，之后就一路走高。

　　-
　　说说最后的打劫。

　　白棋此前一直没有往171位夹进去拼劫（当时没下成这样，少几个子），到了此时白172仍然不往A位长，走成黑B、白C、黑D的黑棋先手劫，而是老老实实的走在172位吃六个黑子。
　　这是一种投降的下法。
　　不提外围的很多阴谋论，就是很多职业棋手也对这个下法很气恼，这并不是他们不相信李世石。

　　客观的从棋局本身来说，白棋的劫材不利，就算打劫也一样是输，而且输的更多。
　　职业棋手们谁都知道这一点，业余高段们也都知道。

　　在围棋里，最终的输赢是哪一方目数哪怕多半目，也将取走全局的胜利。
　　当年藤泽秀行说，如果有100块，大家都认为取走51块就可以了，而他认为应该尽可能取走全部100块。
　　但围棋确实是，你拿到了51块，数完棋发现比对手的49块多两块，那你就可以拿走全部的100块。

　　所以我们平时才说，输半目和输一百目是一样的。
　　所以我们才跟学生们说，这个棋你在落后的时候平平稳稳的下，会100%的输5目，那还不如去拼命，去搏一个99%会输100目却有1%翻盘的可能。
　　这不仅仅是棋手的血性，逻辑也是自洽的。
　　而这，一样是以目数换概率，只不过和前面说过的方向相反。

　　打劫一般比普通的变化复杂，因为涉及各种各样的转换，当然也有更高的概率会拉近局势，降低优势方的获胜概率并提高劣势方的翻盘几率。
　　所以我们经常看到，顶尖高手在劣势下拼命搅局打劫转换，而优势时却常常简明的让劫。
　　所以AlphaGo为了增加获胜概率，始终不怎么打劫。
　　在这种情况下，它打劫的水平高低对我们来说是未知的，有可能确实不好，也有可能其实很厉害。

　　而以李世石的水平，早已算清此时打劫也不赢，但输的更多本来就是一件无所谓的事情，在常见情况下，几乎所有棋手都会在输定的情况下选择拼搏打劫，宁可输更多也拼一个对手犯错的概率（哪怕是极微概率）。
　　而身为顽强闻名世界的韩国人的李世石，身为被誉为“僵尸流”的李世石，从来都是宁死不屈、拼搏到底、自己死全盘也要搅昏对手的李世石，居然退却了，没有去拼。
　　这让大家觉得，他的拼搏精神不够，非常令人奇怪和懊恼。
　　身为曾经的天下第一、棋界永远的真男人的李世石，居然没有表现出自己闻名天下的血性。
　　性格激烈一点的棋手甚至表示，既然他已经丢了血性，那他不配代表人类出战。

　　但我有一种猜想，之前的说法的前提是，输的更多是一件无所谓的事情。
　　但如果有所谓呢？如果在全世界的目光中，或者说在很多很多不懂棋的人的面前，你拼了之后输的更多，然后大家说，啊原来这才是李世石和AlphaGo真正的差距，你会不会对此有所担忧呢？
　　当然，也许并不是这样，而是单纯的面对电脑，提不起面对人时的那种心劲，感觉无所着力。
　　也可能，是因为输棋和感到对手的强大，心力交瘁而放弃此局。
　　也可能上面的原因都有。

　　总之，他选择了不打劫。

　　-
　　至于柯洁对于有信心战胜AlphaGo的言论，那不仅仅是他年轻人的气盛，更是他身位世界第一应有的自信与担当。
　　甚至，这是任何一名棋手都应该有的血性。
　　不论理性分析，对手有多强大，获胜的概率有多小，如果你在对局前完全没有去争胜的动机，对自己完全没有自信，那这棋就不用下了。
　　如果一名棋手这样，他就不配当一名棋手。
　　而柯洁，只是身为现在最强的人类，将这种自信刻意表达的更强烈而已。

　　在两个月前，AlphaGo战胜樊麾老师的消息刚刚曝光时，我写下了如何看待 Google 围棋 AI AlphaGo 击败欧洲围棋冠军？ - 高飞龙的回答，看过的人都应该知道我对人工智能进步的欣喜，和对未来人工智能战胜人类的预期。
　　可是近来，我发现有很多“观众”的心态有些问题。

　　虽然人工智能早晚会在围棋盘上超越人类是一个被包括围棋界在内的几乎所有人都达成了的共识，但这并不说明人类就要等着被超越，并不说明顶尖棋手们就要轻易认输。
　　“看！AlphaGo已经比李世石强了，你们怎么还不认输！还不服输！快跪下来！”
　　好像我们本来就是躺在砧板上的鱼肉，就应该静静的等着刀俎来砍，连弹一下腿儿都是罪过一样。

　　现在的人工智能虽然有了学习能力，但还没有感情，应该是不懂得“认输不服输”才能进步的道理的吧。
　　但人类自己应该懂得吧？

　　这些棋手们、职业棋手们、顶尖职业棋手们，个个都是花费十数年、数十年时间从海量的人群中杀出来，在残酷的竞争环境中淘汰了不可计数的竞争者们，才走到了现在的高度。
　　如果他们没有不服输的血性，那就根本不配代表人类成为职业棋手，也根本就不会在长年的竞争中胜出。
　　甚至，不只是棋手，我觉得所有领域、所有行业、所有人类都应该有这种血性。
　　输了要承认，不要讲七七八八的。
　　但绝不能轻易服输，输了还要想着赢回来，要想着让自己变的更强，这才是应有的态度。

　　诚然，围棋圈内确实有部分人并不是不服输，而是压根就不认输的态度，这样不对。
　　但很多观众走到另一极的态度，我认为同样不妥。

　　-
　　还有一种说法，最近甚为流行，虽然其中一样夹杂着一些刺耳的杂音。

　　围棋界，将迎来一场新的革命。
　　就像当年算砂废座子、道策创手割、吴清源引领新布局法一样。
　　甚至比那几场变革更加彻底，更加伟大。

　　没错，在大家还没意识到有生之年能看到人工智能胜过人类的时候，其实就有很多人在茶余饭后闲聊时调侃过这种可能。
　　那时，还只是玩笑而已。
　　而当这一天出乎所有人的意料提前来到我们眼前时，很多人压根就没有防备。
　　这革命说来就来了。

　　但请注意，我说的是“围棋界”将迎来一场革命，而不是“围棋”将迎来一场革命。
　　这中间的区别可大了去了。

　　围棋，规则简单，范围确定，变化数目在数学上有穷（10^170）却在实际操作中等效于无穷（超过宇宙中的全部原子数10^100），其在规则和范围确定的当天，就已经确定了所有的规律。
　　这规律，就是导向赢棋的最优解。
　　只需要穷尽所有变化，就一定能找到最优解。
　　而这最优解，应该有很多条路，毕竟李喆在六路棋盘上都已经用数学证明存在最优解的多解性了。
　　而在黑白都处于最优时，黑棋获胜的目数，也应该就是贴目的最合理数目。
　　这些道理，大家都很容易想到。

　　人类无法穷尽围棋的所有变化，至少现在不能，未来也看不到希望。
　　人类只是在几千年的不断探索、互相对弈与局后研究中，不断的总结规律，更靠近最优解的规律。
　　而这些规律，被总结成了庞大的理论体系。
　　这体系当然不可能全部是对的，它只是围棋全貌的一小部分，而我们在围棋盘上的发展就是不断的拓展新疆土、逼近最优解的过程。

　　AlphaGo同样无法穷尽所有变化，而且和人类一样还差的很远很远。
　　它是采用模仿人的方式来学习和积累规律，同时以提升获胜概率为决策目的来指导行棋方式的。
　　AlphaGo学习了人类几乎所有的职业对局（其团队曾经找相关棋谱网站要过5万多盘人类对局棋谱），然后从中学习人类几千年来习得的规律，再自己进行海量的自对弈，来消化吸收旧规律和摸索新规律。

　　现在假设有一个“围棋上帝”，他能穷尽所有变化，故而能在与任何对手对战的任何时刻都找到赢棋的最优解。
　　那么，他会考虑赢棋的概率吗？
　　显然不会，他知晓所有的最优解，获胜的概率应该永远是100%（不考虑特殊局面的和棋），最起码输棋的概率肯定是0。
　　那么，当他在面对比他弱的“棋手”时，最优解就应该是在对手下错了部分棋的情况下，追求赢的最多。

　　现在，AlphaGo很可能已经超越了顶尖的人类，在对规律的发现上走出了人类已占有疆土，或者最起码是在人类疆土内，对已有规律的践行成功率超过了任何人类个体。
　　但AlphaGo到达“围棋上帝”了吗？
　　不仅没有，而且可能还离得很远。
　　在这条路上，人类以后可能要追赶人工智能了，而人类和人工智能前进的方向，都是“围棋上帝”。

　　而走在人类前面的人工智能，可以成为人类反向学习的对象。
　　它在围棋盘上习得的规律，很可能比人类已经总结出来的规律更有效，所以导致人类总结规律体系中的部分内容被淘汰和替换。

　　但是，人类几千年来的规律体系，或者说棋理体系，是不可能被全盘推翻的。
　　因为越下层的基础内容，就越是明确。最简单的例子，像两眼成活、大眼气数、对杀规律这种从基本规则直接经过严密的数学逻辑推理出的规律，这些可以用数学公式准确无误的表达出来的棋理，怎么可能被推翻？
　　除非你改变规则。

　　而受到冲击的，可能被替换的规律，必然是上层的规律。
　　而被替换的规律所处位置越下层，对整个体系的影响也越大。
　　但我一定要再强调一次，告诉那些不懂棋却口口声声否认几千年来无数人心血和努力换来的成果的观众们：
　　人类已有的规律体系不会被全部颠覆，而这场革命只会使整个体系更加发展和先进，离围棋上帝更近一步。

　　退一万步说，那些被淘汰、被替换掉的部分，也不是没有意义的，发现总结他们的前辈们的努力，是极为有道理的。
　　任何人类学科领域，都是从初生到成熟，经历无数的试错，后人不断站在前人肩膀上不断前进的。
　　对这种否定之否定的基本马哲规律，应该没有多少不懂的人吧。

　　-
　　举一个例子。

　　在李世石与AlphaGo的第一局中，李世石落下黑141时，AlphaGo应之以白142。
　　白142是一步明确的错着，只须如下图：

　　不挡，而是如白1跳在一四，那么黑棋的处境将比实战差很多。
　　如果黑棋仍然和实战一样脱先，比如走在黑2（随便举例），那么白棋保留3扳、5断的手段，之后A、B两点成见合（即必得其一），那么黑棋只能走更大的A位，而白棋将能够在B位打吃，救出右边三个死子。
　　黑棋要么补一手，和实战相比丢掉了先手，要么脱先而局部给白棋留下这么一个手段，怎么都比实战差太多。

　　在右下这个封闭空间中，人类可以穷尽所有有效变化，也就是会和“围棋上帝”作出同样的决策。
　　可AlphaGo为什么没有这么选择？
　　第一天，大家都认为是它出错了，说明它不是尽善尽美，计算力不够。
　　而第二天，看过了AlphaGo更强大的表现，见识到了它强大的计算力，大家都意识到它不可能在第一局中算不到这个变化。
　　人类都能在这个小封闭空间内穷尽变化，难道它就不能？

　　这一天掀起了神话AlphaGo的狂潮，大家都奔走相告：它是胜率导向的，它认为这么下胜率更高。
　　没错，它肯定是算到了这个变化，并认为这么下不如实战的下法获胜的概率高，所以放弃了这个目数上更好的最优解。
　　这很可能是因为它认为，后续变化变复杂了，所以出错概率提高了，所以获胜概率下降了。

　　这就引出了一个问题：概率导向的决策模型下的目数换概率，一定是最合理的吗？

　　显然不，这是在无法穷尽变化的情况下，做出的一种简化。
　　或者说，这是对人类“棋感”的模仿。
　　这是一种非常优秀的策略，获得了巨大的成功。
　　但这离“围棋上帝”还有相当的距离。

　　我们不难想到，如果是“围棋上帝”来下，当然会选择目数最好的最优解，反正他绝对不会出错的。
　　我们以前曾经认为，如果人工智能有一天超过人类，那么它一定会具有强大的后半盘，在封闭环境之类的局部计算中滴水不漏，而要想在前半盘的开放式局面中胜过人类的大局观，则要困难很多。
　　这种想法很能逻辑自洽，并且也符合很多的实践。

　　但也许我们万万想不到，在AlphaGo的模型下，它的大局观和前半盘如此之强，而在封闭环境中它却居然可能出现错棋。
　　它的计算的确滴水不漏，但它的判断和选择却可能有问题。

　　我这两天每天晚上都睡不着觉，闭上眼睛就会看到棋盘上的这个局部，始终都想不明白。
　　直到今天中午准备“硬创公开课”的讲课内容时，忽然感到理清了头绪。
　　对啊！的确是有问题的！

　　我第一天晚上就想到，它虽然下出了错棋（在此之前的上方也有一个类似的封闭空间的错棋，损了一目，和这个加在一起一共两个“错”），但都是在全局占优时出现的。
　　也就是说，当AlphaGo判断自己获胜概率很高时，出现了这些算清了却选错了的问题。
　　假设它在局势落后的时候遇到这种情况，会怎样呢？它还会选错吗？
　　很可能不会。

　　但无论如何，这都极可能是决策模型的缺陷所在。
　　成也萧何，败也萧何，成就这个决策模型的概率导向很可能存在隐患。
　　现在我们对围棋规律的总结还不够成熟，未来当人类和人工智能在规律总结的路上都走的更远，离今天已经很远了以后，这种模型会不会存在上限呢？
　　如果将来人类要在不断提升自身上限的过程中打败这一代人工智能，或者即使人类自己已经做不到，需要靠新一代的人工智能来打败AlphaGo们的时候，会不会以此作为突破口呢？

　　虽然，这一切都还只是我的猜想而已。

　　-
　　明天，哦不今天，即将要迎来第三局的比赛了。
　　我花费了整整五个小时来梳理这些头绪，这其中借鉴了大量职业高手们反思的意见，尤其是在棋谱分析时借鉴甚至引用了大量李喆的分析，因为不是正式论文，故而不再详细标明。

　　李喆在第二日的比赛后，通宵十二个小时，直到今天的中午十二点才写出了这两盘棋，没人会比李世石做得更好！这篇文章。
　　此文不同于我回答开头给出的那篇对第一局比赛的分析的完全理性思考，而是在获得了更多有关AlphaGo的信息之后，在理性之余掺入了大量感情流露，希望为李世石正名，也尽力扭转围棋界内和界外很多不当的心态，以正视听。
　　一日之间刚转柔，此乃乾坤大挪移第七层的功夫是也。

　　我棋力低微，见识浅薄，对朋友、校友、队友无以为敬，廖做此文而已。

　　今日遥想14年的晚冬某晚，我与李喆在北大校内散步，踩在薄薄的积雪上，他问我对人工智能围棋程序和蒙特卡洛算法是怎么看的，我只给出了些自以为深思熟虑却实则粗陋的想法。
　　而今得观喆兄二文，真如胜读十年书也！

　　也许，作为世界第一的柯洁是现在最接近战胜AlphaGo的人，但李喆很可能是最接近AlphaGo赢棋真相的人。
　　毕竟，连AlphaGo的开发团队都无法将其习得的规律翻译成人类可以懂得的语言呢。

　　我期待着翻译方法从理论转为实践的那一天，期待着人工智能围棋程序真的能成为人类探索围棋规律的工具的那一天。

　　我也为李喆而感概，为这个曾经棋坛最为“有创意、有思想”的棋手，最以愿意尝试新下法闻名世界棋坛的棋手，最不惜以更高的输棋概率来换取对围棋革新的尝试、却可能是因此而没能登上巅峰并为世人唏嘘的棋手而高兴。

　　今天，可能是他曾经在棋坛的所有尝试和探索，以及为开阔思路而到北大哲学系读书的选择，凡此种种，显得最有意义的一天。
他，可能是离真相最近的人。

　　-
　　注：第二局比赛后至今的一日里，大约一百个问题邀请的主要相关内容，我已一并回答在此，无需过多邀请。

附件: 您需要登录才可以下载或查看附件。没有帐号？注册

返回列表

如何评价第二局比赛 AlphaGo 又一次战胜李世石？

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]