返回列表 发帖

知道原理之后,可以断言,AlphaGo不能完全战胜人类

来源:新浪看点  真理是我亲戚  2016年12月29日 12:59

根据聂卫平先生的说法,2016年围棋界的最大的事,不是中国“天才少年”柯洁的横空出世,而是AlphaGo以4:1战胜李世石。


人工智能战胜人类棋手,其实已经不是什么新鲜事了。早在1994年,人工智能“深蓝”就5:0完胜了国际象棋大师卡斯帕罗夫。

然而,22年之后,人类智慧的终极高地——围棋,才被人工智能攻克。

因为中国象棋和国际象棋的可能下法,并不太多。电脑完全可以把中国象棋和国际象棋的所有着法全部记下来,然后选择其中胜率最高的下法就行。

而围棋,由于落子点太多,达19*19共361个点,他的可能下法比宇宙中的原子还要多,每下一个子后面的可能下法,一台超级计算机需要计算很多年。

2016年,AlphaGo正式宣布,电脑总算找到了下围棋的办法——深度神经网络。


深度神经网络听起来挺玄乎,咱也没那智慧去完全弄明白。不过,最近看了古力、周睿羊解说的AlphaGo左右互搏的3盘棋,看了聂卫平先生重温的人机大战第4局,觉得可能初步理解了AlphaGo的围棋下法原理。

AlphaGo的诞生和发展应该有以下三个阶段:

在AlphaGo的诞生之初,肯定是要初始化的。AlphaGo的初始化,应该是就是告诉他围棋的规则,围棋的一些小手筋,以及人类已经下过的几万局围棋对弈棋谱。对于电脑来说,这并不是一件很大工作量的事。甚至可以写出程序,可以让电脑自己读。

然后,需要有一个略微懂围棋的人(当然是樊麾),去设定参数,帮助AlphaGo知道,在每一步棋之后,其实有很多着法是没有意义的,可以不计算。同时,电脑也可以根据已经输入的棋谱,计算人类的可能下法,而不去计算人类没有下过的可能下法。估计,这会省略99.99%以上的工作量。

最后,就是两台AlphaGo不断地对局,或一台AlphaGo左右互搏,下出那些人类没有下过的棋谱来。凡是他曾经对局的棋,又将自动加入他的数据库,成为他可以随时查询的历史棋谱。因为有一个自我学习的过程,因为电脑的对局可以很快,AlphaGo也就在短时间内越来越强大。

这也是为什么在与李世石比赛之前,大家看了AlphaGo与樊麾的5盘比赛,都认为电脑只是二段的水平,而到与李世石比赛时,AlphaGo长棋了。


知道了这些原理,我们就能知道战胜AlphaGo的办法。

那就是要把棋下在AlphaGo的设定参数里,它不会去计算的位置。

如人机大战第4局,李世石下出第78手“挖”之后,电脑突然失控,一阵乱下,直接崩盘了。应该就是那一手,在AlphaGo的参数里,是不会去计算的,他的数据库里,也没有相关资料可以查询。


当然,要下出电脑不计算的棋,并不是那么简单。

一是给电脑设定的参数和电脑自己统计的可能落子点,本来就已经很科学、很丰富了。那些电脑不计算的落子点,基本无价值。如果霸蛮下到那些无价值的点上,又可能无异于自杀。

二是在AlphaGo的不断自我学习提高中,那些不计算的点,会越来越少。


但是,AlphaGo的计算原理决定,它不可能计算出所有落子的可能,同时,由于设定AlphaGo参数的人围棋水平也不是最高,可以肯定的是,AlphaGo永远存在漏洞,人类永远保留着一击制胜的,最后的“神之一手”,电脑不可能像中国象棋、国际象棋一样,100%地战胜人类。

本文为头条号作者原创,未经授权,不得转载。

特别声明:以上文章内容仅代表作者本人观点,不代表新浪看点观点或立场。如有关于作品内容、版权或其它问题请于作品发布后的30日内与新浪看点联系。
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表