返回列表 发帖

深扒阿尔法狗“幕后黑手”... 人机大战专题策划①

2017-04-18 围棋天元

20年前,1997年5月11日,IBM的电脑“深蓝”在6轮比赛中以2胜1负3平的成绩打败了当时的国际象棋冠军卡斯帕罗夫,这一新闻席卷了当时的各大报纸头条。许多人工智能专家预言,电脑在围棋比赛中也可以打败人类,但至少得等到几十年之后。




而让人意想不到的是,在2016年人工智能AlphaGo出现,打败了当时的世界围棋冠军李世石,才过去短短20年,阿尔法狗就在人们公认的最复杂的棋类游戏中以4:1的成绩战胜了韩国围棋第一人。


4月10日,“人机大战”的消息再次传出,关于人类和AI的对抗再次牵动世界的神经。AlphaGo之父杰米斯·哈萨比斯(Demis Hassabis)近日在母校英国剑桥大学做了一场题为“超越人类认知的极限”的演讲,解答了世人对于人工智能,对于阿尔法狗的诸多疑问。


不管5月柯洁与阿法狗的人机大战2.0的结果如何,阿尔法狗也都已经写入传奇。它究竟是谁,它是如何诞生的,如何长大的?让我们今天就走进DeepMind的联合创始人兼CEO德米斯·哈萨比斯(Demis Hassabis)的传奇人生,正是他决定了要开发“阿法狗”。


4岁学棋,全能神童的惊人履历



1976年的伦敦北部,哈萨比斯诞生在一个有希腊-塞浦路斯混血的父亲和新加坡-中国混血的母亲的家庭中,是3个孩子中的老大。


1980年,哈萨比斯4岁,开始下国际象棋。
1984年,哈萨比斯8岁,靠自己得来的比赛奖金买了一台电脑。
1989年,哈萨比斯13岁,获得国际象棋大师头衔。
1991年,哈萨比斯15岁,连跳两级之后,提前从高中毕业。
1993年,哈萨比斯17岁,依靠自学编程开发的游戏,获得的进入顶尖游戏公司“牛蛙”实习。玩腻了西洋棋之后,他开始自己开发游戏,和游戏开发公司牛蛙公司(Bullfrog)和狮头公司(Lionhead)一同开发了《主题公园》(Theme Park)和《黑与白》(Black&White)等几款具有强烈AI色彩的游戏。


同年,在剑桥攻读计算机科学时,他很不满意一些老师所教的狭义人工智能,也就是让程序员给数据“贴标签”,计算机才能理解信息,乃至有一次当面离开老师的讲堂。就在那个时期,哈萨比斯决定创立DeepMind这样的机构,当时将其模糊地定位为研究项目与科技创业的融合体。


2007年,他的一项关于“海马体受损也会影响规划未来”的研究被SCI评为“年度突破”。

2009年,哈萨比斯33岁,取得了脑科学博士学位,并依靠自己在游戏设计上的成就,被选为英国皇家艺术协会的成员。

2011年,哈萨比斯35岁,被游戏、计算机和脑科学武装起来的他,为制造模仿大脑的技术机系统--人工智能成立DeepMindTechnology。

2016年,阿法狗诞生了。


以上还只是哈萨比斯惊人履历的一部分,像保持着蝉联5届脑力奥林匹克运动会全能脑力王(Pentamind)称号纪录这样的成就,还塞不进他的简历之中。毫无疑问,哈萨比斯是一个非凡的英国智力天才。

超级工作狂



在同事眼中,哈萨比斯是一个彻头彻尾的工作狂。每天他都要工作到夜里11点多,然后在大部分人都已经入睡时,他却开始了他所谓的“第二天”,与美国同事进行电话会议,一直持续到1点多。

这之后,是他自己的思考时间,通常会持续至凌晨3点或4点,用来进行自己的思考,包括他的研究、下一个挑战等等。

面对疯狂挖角,离职率为0



在DeepMind的6层办公楼里,所有房间都以人类历史上的天才来命名:特斯拉、拉马努詹、柏拉图、费曼、亚里士多德、居里夫人。

一楼有咖啡厅,桌上足球游戏机,懒人沙发,一应俱全。公司楼顶有一个露天平台,可以观赏到伦敦风景。每周五晚,深度思维的员工都会在楼顶聚会,已经成为惯例。他们还有跑步协会、足球队,以及棋类协会。


deepmind伦敦总部



无论谷歌的竞争对手如何在人工智能领域大举挖人,深度思维的员工离职率至今仍为0。

从键盘到棋盘
为什么会让阿法狗选择学习围棋对弈?



一、极客兴趣使然

哈萨比斯对围棋的兴趣,来自于大学时期。他曾在剑桥的一个高水平围棋社团里学习围棋,并很快沉迷其中。但是因为忙于电脑方面的工作,他没有足够时间去练习,围棋技艺仅停留在业余一段水平,不过,这并不妨碍他喜欢围棋。

这是围棋在欧美传播的一个典型案例。欧美大约有几十万人喜欢围棋,集中在大学和科技界,他们的围棋水平远远不如把围棋当作竞赛或者消遣的东方人,但对围棋中反映的博弈、数学等问题有极大的兴趣。这正是欧美科学家、工程师身上特有的“极客”特质,正是这样的特质让他们往往能够使人类在很多重大问题上取得突破。


这些“极客”特质不会给人类似于中国“书呆子”的印象。哈萨比斯其他方面的爱好也非常广泛,看村上春树的《1Q84》,听莱昂纳德·科恩带有诗意的歌曲,看《星际穿越》电影,是利物浦足球队的死忠,并且玩各类桌游和德州扑克。

在他看来,生活与工作是一致的,兴趣上的口味和投入能反哺到工作之中。兴趣使然,或许这就是哈萨比斯和DeepMind公司选择让阿法狗进军围棋领域的原因之一吧。

二、继象棋之后,挑战不可能

围棋是个历史悠久的游戏,有着3000多年的历史,起源于中国,在亚洲,围棋有着很深的文化意义。孔子还曾指出,围棋是每一个真正的学者都应该掌握的四大技能之一(琴棋书画),所以在亚洲围棋是种艺术,专家们都会玩。


如今,这个游戏更加流行,有4000万人在玩围棋,超过2000多个顶级专家,如果在4-5岁的时候就展示了围棋的天赋,这些小孩将会被选中,并进入特殊的专业围棋学校,在那里,学生从6岁起,每天花12个小时学习围棋,一周七天,天天如此。直到成为这个领域的专家,才可以离开学校毕业。这些专家基本是投入人生全部的精力,去揣摩学习掌握这门技巧。

虽然这个游戏只有两个非常简单的规则,而其复杂性却是难以想象的,一共有10170 (10的170次方) 种可能性,是没有办法穷举出围棋所有的可能结果的。这比象棋的难度高多了,所以围棋一直是人工智能领域的难解之谜。

人类能否做出一个算法来与世界围棋冠军竞争呢?要做到这一点,有两个大的挑战:

①搜索空间庞大(分支因数就有200),一个很好的例子,就是在围棋中,平均每一个棋子有两百个可能的位置,而象棋仅仅是20,围棋的分支因数远大于象棋。

②比这个更难的是,围棋几乎没有一个合适的评价函数来定义谁是赢家,赢了多少;而对于象棋来说,写一个评价函数是非常简单的,因为象棋不仅是个相对简单的游戏,而且是实体的,只用数一下双方的棋子,就能轻而易举得出结论了。


国际象棋



围棋



对于围棋来说,甚至一个小小部分的变动,会完全变化格局,所以每一个小的棋子都对棋局有着至关重要的影响。最难的部分是,象棋在游戏开始的时候,所有的棋子都在棋盘上了,随着游戏的进行,棋子被对方吃掉,棋子数目不断减少,游戏也变得越来越简单。相反,围棋是个建设性的游戏,开始的时候,棋盘是空的,慢慢的下棋双方把棋盘填满。

在围棋里,你必须评估未来可能会发生什么,才能评估当前局势,所以相比较而言,围棋难得多。也有很多人试着将DeepBlue的技术应用在围棋上,但是结果并不理想,这些技术连一个专业的围棋手都打不赢,更别说世界冠军了。

阿尔法狗的运作原理



开发者通过用加强学习的方式来提高人工神经网络算法,希望能够解决这一问题。他们试图通过深度神经网络模仿人类的这种直觉行为,在这里,需要训练两个神经网络,一种是决策网络,开发者从网上下载了成百万的业余围棋游戏,通过监督学习,让阿尔法狗模拟人类下围棋的行为。


使用深度神经网络训练的Policy Network和Value Network



一旦有了这个,只要对系统进行几百万次的训练,通过误差加强学习,对于赢了的情况,让系统意识到,下次出现类似的情形时,更有可能做相似的决定。相反,如果系统输了,那么下次再出现类似的情况,就不会选择这种走法。我们建立了自己的游戏数据库,通过百万次的游戏,对系统进行训练,得到第二种神经网络。选择不同的落子点,经过置信区间进行学习,选出能够赢的情况,这个几率介于0-1之间,0是根本不可能赢,1是百分之百赢。

通过把这两个神经网络结合起来(决策网络和数值网络),我们可以大致预估出当前的情况。这两个神经网络树,通过蒙特卡洛算法,把这种本来不能解决的问题,变得可以解决。

接下来,Deepmind公司在韩国设立了100万美元的奖金,并在2016年3月,与世界围棋冠军李世石进行了对决。李世石先生是围棋界的传奇,在过去的10年里都被认为是最顶级的围棋专家。在对弈过程中,发现他有非常多创新的玩法,有的时候阿尔法狗很难掌控。比赛开始之前,世界上每个人(包括他本人在内)都认为他一定会很轻松就打赢这五场比赛,但实际结果是阿尔法狗以4:1获胜。围棋专家和人工智能领域的专家都称这具有划时代的意义。对于业界人员来说,之前根本没想到。


“我会抱必胜心态、必死信念。我一定要击败阿尔法狗!”对于5月23日至27日与围棋人工智能程序AlphaGo(阿尔法狗)的对弈,目前世界排名第一的中国职业九段柯洁放出豪言。不管结局如何,我们都期待人类和机器带来意想不到的惊喜。


人类智力的发展终究是有限的,而作为人类智力成果的科学技术的发展却是永无止境的。超越输赢的视角,看到背后的无限可能性,才是对这场“人机大战”的正确打开方式。相对于科学技术发展的未来,人类其实还很渺小,还有太多的未知领域需要探索,因而要保持足够的敬畏和强烈的求知欲。这场“人机大战”,向人类顶尖智慧发起挑战,是人工智能近年来取得巨大进步的缩影,也代表了一种不断超越自我、拓展前沿科技的雄心。这才是真正值得深思之处。


文章部分内容摘自网络&剑桥大学神经学博士生,阿尔法狗之父戴密斯·哈萨比斯在英国剑桥大学的校友的言论

整理丨小元元
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表