返回列表 发帖

围棋之“神”来了 这会是机器文明的开始吗?

2017年10月22日11:27 新浪综合


佐为落子



  (文章来源:智慧医工)

  这两天被AlphaGo Zero刷屏了,作为曾经的算法科研工作者,资深医疗器械从业人员,资深围棋爱好者(新浪围棋7段),用这个话题作为我微信个人公众号的第一篇文章,似乎再合适不过了。我们先聊聊一些轻松的话题,最后再对Alpha Zero在医疗领域可能的影响及启发做一些讨论,以作抛砖引玉之用。

  动漫围棋之神 — 藤原佐为

  说到围棋之神,喜欢围棋的大都会联想起日本动漫《棋魂》中主要角色之一藤原佐为,影片中佐为是平安时代的棋士,是与君主或其他大贵族下棋的棋待诏,后来遭陷害而自杀身亡,但对围棋的热诚与执着使其灵魂依附在一个棋盘上。曾附身于本因坊秀策,后来则附身在主角进藤光身上,是引导小光进入围棋世界的最重要的人。性格单纯的棋痴,为追求“神之一手”不遗余力。

  影片中佐为和小光亦师亦友,最后佐为和名人在网上对弈并获胜,震惊日本围棋届。这部动漫广受欢迎,甚至被日本围棋界寄予厚望来激发大众学习围棋的兴趣,增加围棋人口,以改变日本围棋的颓势(PS,日本围棋现在似乎比前几年稍有进步)。




美丽心灵



  还有一部感人至深的影片《美丽心灵》也提到了围棋,影片原型是患有精神分裂症但却在博弈论和微分几何学领域潜心研究,并最终获得诺贝尔经济学奖的数学家约翰·福布斯·纳什。围棋在影片中被顶尖数学家们作为研究博弈论的绝佳工具。


  围棋人工智能发展初期阶段 (60年代到90年代末)— 初学者

  在1997年国际象棋程序深蓝战胜国际象棋特级大师卡斯帕罗夫之后,人类震惊于人工智能的进步,惊呼人工智能将代替人类智慧。但由于围棋的复杂度远远高于国际象棋,加上当时算法的局限性,围棋被认为是最难攻克的棋类游戏,也被认为是人类智慧的最后堡垒。截止2015年,全世界6000多种完全信息博弈游戏中,只有围棋人工智能(下面由围棋AI代替)无法抗衡相关领域的职业选手。

  围棋AI的难度主要体现在两个方面:

搜索空间巨大:合法的围棋的变化(10^170)远大于宇宙中原子数(10^80)。

局势判断难:很多情况下问职业高手,你为什么下那一手,他自己很可能也说不清,棋手们就称之为棋感,因而很难找到合适的数学表达去判断下一步棋的赢棋概率。

  从60年代人工智能萌芽开始就不断有人开始尝试围棋AI,但在开始的二十多年里,围棋AI还不如刚入门的人类初学者。

  1987年,创建围棋奥运会“应氏杯”的应氏围棋基金会悬赏百万美元,寻求能够战胜职业棋手的围棋AI。在当年百万美元可是巨额奖金,四年一次的应氏杯冠军的奖金也不过40万美元。

  巨额的奖金刺激并没有带来围棋AI的迅速突破,直到1990年,中国中山大学退休化学系教授陈志行,编写了名为“手谈”的程序。手谈问世以后几年内,实力快速增长,并在1995至1998年,手谈在两项计算机围棋世界赛中七连冠,在整个九十年代围棋AI中独领风骚,陈教授也拿到了应氏围棋基金会的总共六十万新台币的奖金。90年代末的手谈和业余高手还有受让十子的差距,围棋AI仍然任重道远。直到陈教授在2008年去世,手谈也没能过陈教授的九子关。

  围棋人工智能发展中级阶段 (21世纪初 - 2015)— 业余高手

  在1997年深蓝战胜卡斯帕罗夫之后,工程师Darren Cook, 向业界,包括陈教授,和几位ghh职业棋手,提了一个问题:什么时候才能有围棋AI达到业余初段水平? 回答五花八门,有说三年以后,陈教授说2020年,有个职业棋手说要到23世纪。

  其中最有意思的是,一位计算机科学家,名叫John Tromp的回复,到2011年,不可能有围棋程序战胜我。John当时是欧洲业余一级,比业余初段只低一个级别。

  从二十世纪初开始,科学家们开始用蒙特卡洛树搜索法来构建围棋AI,取得了很好的效果。采用蒙特卡洛树搜索的MoGo在2008年受让九子战胜金明完九段。次年,MoGo受让六子战胜简立辰初段。看来业余初段似乎已经不是AI们的对手。不过,John的围棋水平在过去的十几年里,也已经从业余1级进步到了业余2段。赌局最后期限临近,悬念竟然不跌反增。2010年末,John Tromp 与 当时的一流程序多面围棋大战四局。结果令人大跌眼镜,John 以4比0横扫多面围棋。而且,从棋局弄来看,多面围棋毫无还手之力。John就此赢得一千美元的赌金。

  不过Darren不服呀,明明程序们已经超出了业余初段的水平,只不过是你John也进步了。Darren坚信围棋AI的进步要比John快的多,于是约定两年以后再比一场!

  2012年,John再次坐在了与人工智能的对决台上。这一次他的对手是Zen。结果,John居然赢下了第一局。不过,Zen随后没有再给John机会,连胜三局,从而赢得了最终的胜利。“初段赌局”就此画上句号。

  同年,Zen突破了”宇宙流“武宫正树九段的五子关,四子关,意味着围棋AI达到业余高手水平。

  就在围棋AI业内一片乐观之时,2015年末,在北京的世界围棋人工智能大会上,程序石子旋风力挫Zen夺冠。在随后的人机对抗中,中国的连笑七段让石子旋风四子和五子局皆胜,让六子才败于石子旋风。赛后,国家队总教练俞斌说,围棋AI战胜职业棋手,恐怕还需要一百年。即使是参赛程序开发者们的“乐观估计”,也认为这需要十几年。

  当时在场的人并不知道,在英国,有一个围棋AI正在诞生并迅速成长,已经战胜了一位职业棋手。他就是AlphaGo。

  围棋人工智能发展高级阶段 — 超越职业棋手

  2016年初,Deepmind的David Silver等人 在顶级科学期刊Nature上发表论文,介绍了他们的围棋AI解决方案,Alphago。AlphaGo在没有任何让子的情况下以5:0完胜欧洲冠军,职业围棋二段樊麾。


  在AlphaGo中研究者使用的是”深度学习“(Deep learning)。深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,无人驾驶汽车,自然语言处理,语音识别,分析生物信息数据等非常复杂的任务。

  AlphaGo 的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “价值网络”(value network)。它们的任务在于合作“挑选”出那些赢棋概率高的下一步,从而将计算量控制在计算机可以完成的范围里。


  研究者用大量专业棋局训练AI,这种方法称为监督学习(supervised learning),然后让AI和自己对弈,这种方法称为强化学习(reinforcement learning),每次对弈都能让围棋AI棋力进步,最终完成了对职业棋手的超越。

  在战胜欧洲冠军后,AlphaGo就发出了向人类顶尖棋手,韩国传奇九段棋手李世石的挑战。人们寄希望于李世石能够阻挡住围棋AI的冲击,守住棋类上人类智慧最后的骄傲。


  2016年3月,万众期盼的人机大战开始,5盘系列赛,为更好测试围棋AI性能,约定无论胜负,5盘要全部下完。事先多位职业棋手自信满满,认为战胜樊麾的AlphaGo,从棋局内容来看,还有明显得漏洞,无法战胜李世石。可是几个月之后的AlphaGo在研究者的努力下,已非吴下阿蒙,直落三局,而且从棋局内容来看,李世石几乎是完败,虽然看上去差距并不是那么大,但可怕的是,李世石已经发挥地近乎完美,仍然通盘看不到什么机会。这让职业棋手们在集体沉默之后,惊呼人类已经没有机会。5盘系列赛,0:3之后胜负已分,在这之后,李世石反而放下包袱,在第四局的比赛中,李世石下出白78“神之一手”,导致AlphaGo误判形势,直到5步棋后才意识到形势不利。李世石中盘获胜,取得对AlphaGo的首场胜利。这一局胜利,似乎让职业棋手们又看希望。然而第五局,AlphaGo没有再给李世石机会,最终人机大战总比分定格在1:4。比赛的结果虽然让职业棋手们很难接受,但也保留了一丝颜面和希望。

  2017年5月,浙江乌镇,当今世界围棋排名第一的柯洁迎来了他的AI对手AlphaGo Master,然而这次的对决,胜负早已不再有悬念,因为在今年年初,AlphaGo Master已经在网上以快棋60:0挑落中日韩各路高手,柯洁在比赛的前一个晚上发微博表示这将是他和人工智能最后的对决。比赛也缩短为3局胜负。果不其然,竭尽全力的当今第一人,不满20岁的柯洁还是以0:3败下阵来。赛后,DeepMind团队宣布AlphaGo退出江湖,不再寻求与人类比赛。这时的AlphaGo已是独孤求败。

  可是AlphaGo的进化并没有结束,2017年10月,DeepMind团队再次在Nature上发表重磅文章,这一次,他们彻底抛弃了人类经验,仅仅依靠强化学习,左右互搏,在短短训练了三天就超过了击败李世石的版本,40天后超越击败柯洁的Master 版本。这就是最新的AlphaGo Zero。AlphaGo学习的速度让人震惊,这次震惊的不再仅仅是围棋人士,而是人工智能业,甚至整个科学界,整个社会。


  围棋之神是全能的神吗?

  由于AlphaGo的采用的算法是一种通用的人工智能方法,在AlphaGo突飞猛进的同时,对弈之外,DeepMind团队希望能应用到其他领域,如新材料开发,新药的化学结构探索等等,但这还需要时间和实践的验证。

  围棋是一种完全信息博弈游戏,所谓完全信息博弈 :是指每一参与者都拥有所有其他参与者的特征 、策略及得益函数等方面的准确信息的博弈。而我们在现实世界的所需要攻克的应用,比如无人驾驶,医疗AI等等,更多的是非完全信息博弈,因此AlphaGo的技术无法简单的应用到其他领域。

  虽然如此,AlphaGo Zero的进步也是里程碑式的,她完美地集成了现有技术,在围棋领域取得了难以置信的突破,证明了纯强化学习也可以达到的高度,必然会激励更多的研究者投入人工智能的研究。

  AlphaGo Zero对医疗AI的启发

  除了语音识别,图像识别,无人驾驶,新材料开发,人工智能在医疗领域的应用也是重要的方向之一,也是大批资金看好的方向。AlphaGo Zero的算法和架构,如果能够成功复制到医疗的一些领域,在我看来,有以下几个可能的影响:

  由于算法效率大幅提升,在人工智能的一些方向,如医学影像的辅助诊断,医学检验,基因检测,放射治疗的计划设计,会取得一些突破性进展,人工智能的准确度,可用性显著改善,临床普及程度快速提高。

  AlphaGo Zero本质上并不是没有数据,而是利用明确规则,优秀的策略,模拟了大量数据,因此,对那些规则明确,机理清楚的应用会率先取得突破。

  AlphaGo Zero向我们证明了算法的威力,会激励更多的科学家努力改进算法,k有可能改变现在业内现在过度依赖数据的趋势。一些缺乏资金获取大数据的初创企业如果有好的算法并找到合适的应用方向完全有可能突围而出。

  期待人工智能在医疗的应用能在AplhaGo Zero的助推之下百花齐放,更上一层楼。

  人工智能对人类是威胁吗?


  在Deepmind发布AlphaGo Zero后,棋士柯洁不由得感叹对于Alphago的自我进步来说,人类太多余了。

  毋庸置疑,AlphaGo Zero的已经是当前计算机围棋的极致,特别是其进化速度的出人意料,再度引发了一些人的人工智能威胁论。极端忧虑者认为机器已经无需人类帮助,自我进化,机器文明似乎已经在不远的将来向我们招手,人类文明再无翻身可能,黑客帝国中人类生活在机器文明的虚拟世界中,仅仅成为生产能量的载体的恐怖场景也似乎不无可能。但人工智能并不是万能的。AlphaGo Zero只能说是在围棋超越了人类,甚至还说不上已经接近围棋最优解,更不具有自主思考和自我意识。即使是在围棋上独孤求败的AlphaGo Zero,也是在人类定下目标,做好优化而已。

  我相信,更令人值得担忧的是,人工智能的快速发展,可能会加剧社会分配的二级分化,形成类似《北京折叠》的分裂社会。这需要方方面面的人工智能参与者能够站在更高的角度去制定政策,分担社会责任以减少人工智能发展可能带来的负面效果,让我们期待一个美好的智能社会将来,而不是有更多分裂,更多冲突的将来。
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表