深扒阿尔法狗“幕后黑手”... 人机大战专题策划①

2017-04-18 围棋天元

20年前，1997年5月11日，IBM的电脑“深蓝”在6轮比赛中以2胜1负3平的成绩打败了当时的国际象棋冠军卡斯帕罗夫，这一新闻席卷了当时的各大报纸头条。许多人工智能专家预言，电脑在围棋比赛中也可以打败人类，但至少得等到几十年之后。

而让人意想不到的是，在2016年人工智能AlphaGo出现，打败了当时的世界围棋冠军李世石，才过去短短20年，阿尔法狗就在人们公认的最复杂的棋类游戏中以4:1的成绩战胜了韩国围棋第一人。

4月10日，“人机大战”的消息再次传出，关于人类和AI的对抗再次牵动世界的神经。AlphaGo之父杰米斯·哈萨比斯（Demis Hassabis）近日在母校英国剑桥大学做了一场题为“超越人类认知的极限”的演讲，解答了世人对于人工智能，对于阿尔法狗的诸多疑问。

不管5月柯洁与阿法狗的人机大战2.0的结果如何，阿尔法狗也都已经写入传奇。它究竟是谁，它是如何诞生的，如何长大的？让我们今天就走进DeepMind的联合创始人兼CEO德米斯·哈萨比斯（Demis Hassabis）的传奇人生，正是他决定了要开发“阿法狗”。

4岁学棋，全能神童的惊人履历

1976年的伦敦北部，哈萨比斯诞生在一个有希腊-塞浦路斯混血的父亲和新加坡-中国混血的母亲的家庭中，是3个孩子中的老大。

1980年，哈萨比斯4岁，开始下国际象棋。
1984年，哈萨比斯8岁，靠自己得来的比赛奖金买了一台电脑。
1989年，哈萨比斯13岁，获得国际象棋大师头衔。
1991年，哈萨比斯15岁，连跳两级之后，提前从高中毕业。
1993年，哈萨比斯17岁，依靠自学编程开发的游戏，获得的进入顶尖游戏公司“牛蛙”实习。玩腻了西洋棋之后，他开始自己开发游戏，和游戏开发公司牛蛙公司（Bullfrog）和狮头公司（Lionhead）一同开发了《主题公园》（Theme Park）和《黑与白》（Black&White）等几款具有强烈AI色彩的游戏。

同年，在剑桥攻读计算机科学时，他很不满意一些老师所教的狭义人工智能，也就是让程序员给数据“贴标签”，计算机才能理解信息，乃至有一次当面离开老师的讲堂。就在那个时期，哈萨比斯决定创立DeepMind这样的机构，当时将其模糊地定位为研究项目与科技创业的融合体。

2007年，他的一项关于“海马体受损也会影响规划未来”的研究被SCI评为“年度突破”。

2009年，哈萨比斯33岁，取得了脑科学博士学位，并依靠自己在游戏设计上的成就，被选为英国皇家艺术协会的成员。

2011年，哈萨比斯35岁，被游戏、计算机和脑科学武装起来的他，为制造模仿大脑的技术机系统--人工智能成立DeepMindTechnology。

2016年，阿法狗诞生了。

以上还只是哈萨比斯惊人履历的一部分，像保持着蝉联5届脑力奥林匹克运动会全能脑力王（Pentamind）称号纪录这样的成就，还塞不进他的简历之中。毫无疑问，哈萨比斯是一个非凡的英国智力天才。

超级工作狂

在同事眼中，哈萨比斯是一个彻头彻尾的工作狂。每天他都要工作到夜里11点多，然后在大部分人都已经入睡时，他却开始了他所谓的“第二天”，与美国同事进行电话会议，一直持续到1点多。

这之后，是他自己的思考时间，通常会持续至凌晨3点或4点，用来进行自己的思考，包括他的研究、下一个挑战等等。

面对疯狂挖角，离职率为0

在DeepMind的6层办公楼里，所有房间都以人类历史上的天才来命名：特斯拉、拉马努詹、柏拉图、费曼、亚里士多德、居里夫人。

一楼有咖啡厅，桌上足球游戏机，懒人沙发，一应俱全。公司楼顶有一个露天平台，可以观赏到伦敦风景。每周五晚，深度思维的员工都会在楼顶聚会，已经成为惯例。他们还有跑步协会、足球队，以及棋类协会。

deepmind伦敦总部

无论谷歌的竞争对手如何在人工智能领域大举挖人，深度思维的员工离职率至今仍为0。

从键盘到棋盘
为什么会让阿法狗选择学习围棋对弈？

一、极客兴趣使然

哈萨比斯对围棋的兴趣，来自于大学时期。他曾在剑桥的一个高水平围棋社团里学习围棋，并很快沉迷其中。但是因为忙于电脑方面的工作，他没有足够时间去练习，围棋技艺仅停留在业余一段水平，不过，这并不妨碍他喜欢围棋。

这是围棋在欧美传播的一个典型案例。欧美大约有几十万人喜欢围棋，集中在大学和科技界，他们的围棋水平远远不如把围棋当作竞赛或者消遣的东方人，但对围棋中反映的博弈、数学等问题有极大的兴趣。这正是欧美科学家、工程师身上特有的“极客”特质，正是这样的特质让他们往往能够使人类在很多重大问题上取得突破。

这些“极客”特质不会给人类似于中国“书呆子”的印象。哈萨比斯其他方面的爱好也非常广泛，看村上春树的《1Q84》，听莱昂纳德·科恩带有诗意的歌曲，看《星际穿越》电影，是利物浦足球队的死忠，并且玩各类桌游和德州扑克。

在他看来，生活与工作是一致的，兴趣上的口味和投入能反哺到工作之中。兴趣使然，或许这就是哈萨比斯和DeepMind公司选择让阿法狗进军围棋领域的原因之一吧。

二、继象棋之后，挑战不可能

围棋是个历史悠久的游戏，有着3000多年的历史，起源于中国，在亚洲，围棋有着很深的文化意义。孔子还曾指出，围棋是每一个真正的学者都应该掌握的四大技能之一（琴棋书画），所以在亚洲围棋是种艺术，专家们都会玩。

如今，这个游戏更加流行，有4000万人在玩围棋，超过2000多个顶级专家，如果在4-5岁的时候就展示了围棋的天赋，这些小孩将会被选中，并进入特殊的专业围棋学校，在那里，学生从6岁起，每天花12个小时学习围棋，一周七天，天天如此。直到成为这个领域的专家，才可以离开学校毕业。这些专家基本是投入人生全部的精力，去揣摩学习掌握这门技巧。

虽然这个游戏只有两个非常简单的规则，而其复杂性却是难以想象的，一共有10170 （10的170次方） 种可能性，是没有办法穷举出围棋所有的可能结果的。这比象棋的难度高多了，所以围棋一直是人工智能领域的难解之谜。

人类能否做出一个算法来与世界围棋冠军竞争呢？要做到这一点，有两个大的挑战：

①搜索空间庞大（分支因数就有200），一个很好的例子，就是在围棋中，平均每一个棋子有两百个可能的位置，而象棋仅仅是20，围棋的分支因数远大于象棋。

②比这个更难的是，围棋几乎没有一个合适的评价函数来定义谁是赢家，赢了多少；而对于象棋来说，写一个评价函数是非常简单的，因为象棋不仅是个相对简单的游戏，而且是实体的，只用数一下双方的棋子，就能轻而易举得出结论了。

国际象棋

围棋

对于围棋来说，甚至一个小小部分的变动，会完全变化格局，所以每一个小的棋子都对棋局有着至关重要的影响。最难的部分是，象棋在游戏开始的时候，所有的棋子都在棋盘上了，随着游戏的进行，棋子被对方吃掉，棋子数目不断减少，游戏也变得越来越简单。相反，围棋是个建设性的游戏，开始的时候，棋盘是空的，慢慢的下棋双方把棋盘填满。

在围棋里，你必须评估未来可能会发生什么，才能评估当前局势，所以相比较而言，围棋难得多。也有很多人试着将DeepBlue的技术应用在围棋上，但是结果并不理想，这些技术连一个专业的围棋手都打不赢，更别说世界冠军了。

阿尔法狗的运作原理

开发者通过用加强学习的方式来提高人工神经网络算法，希望能够解决这一问题。他们试图通过深度神经网络模仿人类的这种直觉行为，在这里，需要训练两个神经网络，一种是决策网络，开发者从网上下载了成百万的业余围棋游戏，通过监督学习，让阿尔法狗模拟人类下围棋的行为。

使用深度神经网络训练的Policy Network和Value Network

一旦有了这个，只要对系统进行几百万次的训练，通过误差加强学习，对于赢了的情况，让系统意识到，下次出现类似的情形时，更有可能做相似的决定。相反，如果系统输了，那么下次再出现类似的情况，就不会选择这种走法。我们建立了自己的游戏数据库，通过百万次的游戏，对系统进行训练，得到第二种神经网络。选择不同的落子点，经过置信区间进行学习，选出能够赢的情况，这个几率介于0-1之间，0是根本不可能赢，1是百分之百赢。

通过把这两个神经网络结合起来（决策网络和数值网络），我们可以大致预估出当前的情况。这两个神经网络树，通过蒙特卡洛算法，把这种本来不能解决的问题，变得可以解决。

接下来，Deepmind公司在韩国设立了100万美元的奖金，并在2016年3月，与世界围棋冠军李世石进行了对决。李世石先生是围棋界的传奇，在过去的10年里都被认为是最顶级的围棋专家。在对弈过程中，发现他有非常多创新的玩法，有的时候阿尔法狗很难掌控。比赛开始之前，世界上每个人（包括他本人在内）都认为他一定会很轻松就打赢这五场比赛，但实际结果是阿尔法狗以4:1获胜。围棋专家和人工智能领域的专家都称这具有划时代的意义。对于业界人员来说，之前根本没想到。

“我会抱必胜心态、必死信念。我一定要击败阿尔法狗！”对于5月23日至27日与围棋人工智能程序AlphaGo（阿尔法狗）的对弈，目前世界排名第一的中国职业九段柯洁放出豪言。不管结局如何，我们都期待人类和机器带来意想不到的惊喜。

人类智力的发展终究是有限的，而作为人类智力成果的科学技术的发展却是永无止境的。超越输赢的视角，看到背后的无限可能性，才是对这场“人机大战”的正确打开方式。相对于科学技术发展的未来，人类其实还很渺小，还有太多的未知领域需要探索，因而要保持足够的敬畏和强烈的求知欲。这场“人机大战”，向人类顶尖智慧发起挑战，是人工智能近年来取得巨大进步的缩影，也代表了一种不断超越自我、拓展前沿科技的雄心。这才是真正值得深思之处。

文章部分内容摘自网络&剑桥大学神经学博士生，阿尔法狗之父戴密斯·哈萨比斯在英国剑桥大学的校友的言论

整理丨小元元

附件: 您需要登录才可以下载或查看附件。没有帐号？注册

返回列表

深扒阿尔法狗“幕后黑手”... 人机大战专题策划①

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]