返回列表 发帖

AlphaGo首战告捷,科学人带你边看边评

2016-03-09 科学人

  举世瞩目的围棋人机大战今日揭幕。一方是Google DeepMind的围棋AI AlphaGo,另一方是韩国职业九段棋手李世乭。

  比赛采用中国规则,黑贴3又3/4子(合7.5 目)。每方自由支配时间2小时,用完后每手棋限时60秒,有三次超时读秒机会,先读完者判负。

  在比赛的当口,科学人找来了四位人工智能和计算机领域的科学家,与围棋国手刘菁一起边看对弈,边聊AI:

  冯建峰:复旦大学类脑人工智能科学与技术研究院院长;上海脑科学与人工智能重大项目首席科学家, 国家“千人计划”特聘教授,上海数学中心首席教授。

  孙富春:清华大学计算机科学与技术系教授,博士生导师,系学术委员会主任,智能技术与系统国家重点实验室常务副主任。

  俞扬:南京大学副教授。主要研究领域为人工智能、机器学习、演化计算、数据挖掘,特别关注演化计算的理论基础与演化学习。

  何万青:中国计算机学会CCF理事,CCF 高性能专委会理事,CCF YOCSEF现任总部AC兼学术秘书,候任副主席。

  刘菁:中国职业八段围棋棋手。


比赛现场。图片来源:Google



  科学人:这五盘棋,诸位看好谁赢?

  孙富春:我猜电脑赢。因为比赛宣传过度,人可能压力太大。电脑可没压力。

  俞扬:如果非要预测,我目前觉得李世乭赢面更大。

  冯建峰:总体而言,我个人觉得还是应该人取胜。当然,许多压力极端条件下,意想不到的情况也不是不可能发生。

  何万青:我也认为AlphaGo会赢。这个猜测建立在如下假设之上:人有情绪、体力和注意力的变动缺陷,但 AlphaGo可以不受情绪干扰。而且5局对弈的时间很长,越往后AlphaGo从比赛中学到的招越多。

  刘菁:扫了一眼棋局,觉得形势很复杂。AlphaGo比想象中厉害啊。


开始不久后的战局。图片来源:直播截图



  科学人:人类和电脑对弈,在决策上有哪些差别?

  何万青:第一,人类决策可以观察对手下棋之外的信息,比如如表情,身体语言,产生的联想判读对方的下一步,AlphaGo 不能。

  第二,人类可以有意识地以“诱敌”为目的走“非最优”的下一步,而且能产生新的模式,AlphaGo不能,新模式的产生受限于随机算法的分布。

  第三,受情绪波动,体能等生物因素影响,人类决策可能出现“不可预知的非理性”。Alphago不会,基于算法的决策都是“机器理性”的。

  第四,从处理能力来讲,人本质上思维“一心不可二用”,机器的算法可以利用多核多线程算法,长期看人的昏招率要高于机器。

  冯建峰:其实我们对人脑的决策知之甚少了,通常认为是前额叶中的DLPFC来完成的,因此其实很难来比较。大多数机器学习的决策主要通过穷举可比较结果来实现,机器对穷举和数字的计算能力已远远超越人脑。人脑用的完全是别的途径。

  俞扬:有一点可以对比:AlphaGo下棋的局数已经远远超过所有的人类,如果不能战胜李世乭,则可以推断出其学习能力还远不及人。


解说员在点评棋局。图片来源:Google

  科学人:AlphaGo的深度神经网络具体是怎么学习的,我们能不能看到?

  俞扬:神经网络通常被认为是“黑箱”模型,意思是人们并不了解神经网络学习到的内容。不过,人们对于神经网络如何进行学习、如何根据数据调整内部的权值等等,却是十分清楚的,也就是说,虽然我们不知道神经网络在想什么,但是不会超过设计者让它想的范围(实际上通常都不能令设计者满意)。

  也有不少研究能让神经网络这个“黑箱”变“白”,例如南京大学周志华教授关于神经网络规则抽取的工作,能够让人了解“黑箱”中的内容。

  何万青:但是深层神经网络的发展,其数学表达和模型,没有意识层面上可对应的算法组合,是通过大规模分布式的“生物模拟”神经元的输入输出信号的加权平均来模拟输出。某种程度上,是“潜意识”的数值模拟——这种模拟由于无法对应可解析的算式,可以说人类会越来越不了解AI的行为模式。神经网络的发展,如果无法应用先验知识的表达,会加重这种“黑箱”的过程。

  这是,科学家相谈正欢,棋局却数次陡变:

  刘菁:电脑越下越臭,从进程看明显还是有差距。

  ……这棋完全没悬念了,除非李世石出一个惊天大错。

  ……右下方小李似乎又保守了 形势再度接近。

  ……两头都损失后,我认为变成细棋(最后胜负很小 双方都有机会),也许机器认为小胜了。


  科学人:更多地效仿人脑能让AI变得更强吗?还是需要另辟蹊径?

  冯建峰:两者并不矛盾。今天我们AI研究中多采用问题驱动的研究方式,要做一个一般性的AI系统还是很难。深度学习为例,它是采用了视觉皮层的结构方式,加上了一些人工的数学方法来实现的。本身就是二者的结合。人类大脑是七百多万年的进化的结果,人脑也许给我们发展AI提供一个十分有用的蓝本。

  何万青:在人类的认知心理学和思考模式能够被科学揭示之前,当前的AI只是用一种“启发式”的方法去模拟“大量神经元”的简单输入输出行为来“假设”模拟人的思考方式,而人的思考方式到底是怎样的,还有赖于神经科学,认知心理学,化学等等很多科学的基础发现。所以当前用神经网络算法模拟围棋博弈的做法,还是走在老路上,并没有突破。新的路线不止一条。

  俞扬:据我所知,目前神经科学家还没能揭开人类思考的秘密,对于我们尚不清楚原理的事物,或许也无从模拟。曾经有人为了模拟鸟类飞行给自己贴上羽毛,今天大家都知道这么做是行不通的。我认为“仿生”这条路,是从观察中发现原理并应用原理来解决我们的问题,而不是简单的照葫芦画瓢。所以我觉得其实只有一条寻找原理之路,只是方法不同。

  孙富春:AI应该有自己的发展思路,否则就是human intelligence了。


韩国媒体室现场。图片来源:Google



  科学人:IBM的Waston除了答题,还能辅助医疗诊断。如果AlphaGo赢下战斗,或者惨败淡出,不下围棋了,它还能做些啥吗?

  冯建峰:这个答案是毋庸置疑的。我们面临的许多计算问题实际上是复杂系统的优化问题。以前有些成功例子如遗传算法,模拟退火等都取得了极大成功。Alpha Go 会成为下一代的优化算法?我们拭目以待。

  孙富春:可以干很多啊,博弈,战争等等。

  刘菁:机器确实要赢了。仔细数了目,差距无法挽回。

不久之后,经过鏖战的李世乭认输了!



最终的棋局,黑子是李世乭。图片来源:直播截图



  “李世乭下法强硬,但AlphaGo并未退缩。AlphaGo用去了绝大部分时间,而李世石剩下了近半小时的自由时间。”

——谷歌首场战报。



  科学人:第一盘被AlphaGo拿下!感觉如何?堪比深蓝赢下卡斯帕罗夫吗?

  何万青:不出所料。在和机器打交道的那么多年里,我学到了一个真理:“你可以相信机器,人是最不靠谱的”(笑)。

  AlphaGo和深蓝都是应用算法从人类对弈的棋局中进行学习,加上利用随机算法产生对自身算法的矫正的一个加权平均。AlphaGo的突破只是在复杂度的规模上,考虑到摩尔定律带来的计算力的突破,这个变化仍然属于量变。

  孙富春:意义不如深蓝。深蓝是突破性的。

  俞扬:我认为意义相当。下国际象棋的深蓝,其核心算法“Alpha-Beta搜索”能够用在其他搜索问题上,AlphaGo的核心算法包括神经网络和蒙特卡洛树搜索同样可以用在其他问题上。实际上,倒过来说可能更合适:神经网络和蒙特卡洛树搜索算法早已用在别处,这次围棋对弈是对它们性能的一次检验。

  冯建峰:围棋对人工智能的‘’智能‘’方面的需求比国际象棋要大得多得多,也更有意义。

  刘菁:今天没有看出电脑超越人类的认知水平。不过如果明天小李正常下还是输,那我得修正观点了。也许本来就是人类的认知有问题,在电脑眼里一切尽在掌控。每一手不用追求最佳但追求怎样才能胜率最高对这么复杂的围棋来说对付人类足够了


第一场比赛以李世乭认输落下帷幕。图片来源:Google



  科学人:经过今天这一战,“AI威胁论”又多一个论据了吗?

  俞扬:AI不会统治世界,控制AI的人倒有可能。

  孙富春:至少目前还是杞人忧天。

  何万青:我是同意AI威胁论的,并不是因为AI全面超越人类而对人类有威胁——这个威胁如同某种肆虐的病毒,某种大规模毁灭武器“统治世界”是一样的道理,背后还是人类本身的配合和不作为。

  刘菁:阿法狗还能复盘的话。所有人类围棋老师全部失业啦(笑)。

  科学人:越往后,AlphaGo下过的棋只会越来越多。它的进步有上限吗?

  孙富春:应该有上限,不可能无限学习。

  俞扬:以个人经验,不仅有上限,而且很快就会接近上限。从AlphaGo的报道来看,DeepMind已经在想办法避免“过拟合”,也就是越学越差,的情况,这说明他们可能已经碰到了上限。

  何万青:强化学习的神经网络算法和其它以某种收敛的极值为判据的算法一样,都存在饱和的问题。训练数据的泛化能力一定会达到某个上限,使得相互学习无法再进行下去。

  这个是和算法有关的——使算法内部加入一定的“抖动”因子,也就是MonteCarlo 积分,基于随机数和随机分布。而目前的“随机数发生器”基本是采用伪随机生成的算法,和跳跃思维的人类比,“随机”的程度也是有限的,也就是一般比喻作“蝴蝶”的算法,一样也存在某个上限,这个上限是由算法本身的复杂度有限决定的。



  这边厢科学家们兴致勃勃地说了一轮,那边厢棋届人士“哀叹刷屏”。历此一役,职业棋手们也有话要讲:

  李世乭(韩国职业围棋九段棋手):作为棋手,我的大赛经验比较多,第一盘输了并不会动摇我的内心。我认为胜负才刚刚开始,我会继续去了解对手,现在来评价AlphaGo为时尚早。

  刘菁(中国职业围棋八段棋手):还来不及反应,一切来得似乎是太快了!面对毫无表情,连厕所都不上的阿尔法狗,4000年围棋的终结者今天就来了吗?空气中弥漫着机器的味道。

  柯洁(中国围棋职业九段棋手):就算阿法狗战胜了李世石,但它赢不了我。



  接下来的四盘比赛,李世乭是否能够扭转局势?AlphaGo又能否再有惊人表现?在3月10日、12日、13日、15日中午12点,围棋人机大战将继续进行。科学人也将继续与你一同关注。

  (编辑、排版:Calo)
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表