返回列表 发帖

近几天的一些零碎杂感-关于柯洁世界第一宝座、三星杯、AlphaZero

来源:弈客围棋  2017年12月8日   棋友文采  庆丰


本文来源于微信公众号:庆丰棋圣木可三吉

(1)柯洁失去稳坐长达1200天的世界排名第一的宝座:

首先这确实构成了一个新闻。并不是一个毛毛雨、波澜不惊的乡野杂闻。


根据凤凰体育的报道,2014年8月14日,柯洁在GoRatings等级分上超越朴廷桓,成为世界第一。这个日期我还是第一次知道。

去年一度AlphaGo等级分超过了柯洁,尽管那个积分计算方法存在争议,但仅从结果上说,如果把AlphaGo加进这个排名,TA的排名高过柯洁是一个符合棋力对比的结果,因此不算离谱。今年年初,AlphaGo和DeepZenGo都从这个排名榜单中消失,也属合情理,以后就是纯人类棋手之间的排名较量了。

如果不考虑AlphaGo的乱入,柯洁在世界第一的位置上稳坐1200余天,可以说是非常强劲了。

但是随着最新一期的GoRatings等级分排名出炉,柯洁被朴廷桓反超。再次登顶的朴廷桓比柯洁高出10分。这个差距不算大,1-2盘棋的差距而已。


不过近几天朴九段又有几盘棋要下,而且已经赢了一盘(对手排名不太高,涨分估计不多,但也会涨一点),柯九段暂时没有比赛,需要等到接下来的智力精英赛再较高下了。

(2)近来还有一个明星“棋手”再次引发了相当范围内的轰动,这就是我们熟悉又陌生的AlphaZero。

咦,是不是写错了,难道不是AlphaGo Zero吗?请看DeepMind最新的论文标题,大家就明白了。Chess是国际象棋,Shogi是将棋(你可以理解为日本象棋)。


DeepMind的团队干了一件什么事呢?

他们让基于AlphaGo Zero的算法改进后的AlphaZero去下国际象棋和将棋。当然,也下了围棋。

经过很短时间的训练,AlphaZero超越了最强的国际象棋软件,超越了最强的将棋软件,而这两种棋类软件都被证明是强于人类最强棋手的软件,甚至国际象棋软件被认为接近完美。但AlphaZero完胜了它们。

同时,AlphaZero在下围棋是,不但迅速超越了AlphaGo Lee的版本,而且连Nature今年新发表的论文中所述之最强围棋软件——强于AlphaGo Master的AlphaGo Zero也被最新的AlphaZero打败。


这说明,AlphaZero已经基本达到了棋类“通用人工智能”的层次,它不需要输入人类“专家知识和数据”,只需要从最基本的棋类规则开始,通过机器学习自我提升,即可达到超越人类的高度。

相比于其他的围棋AI,DeepMind在立意上已经明显领先一筹。专家补丁的思路从根源上落后于纯粹的机器学习。这也说明一个道理:在可计算的领域,数学工具高于经验规律,纯粹的数学工具高于经验规律和数学工具的杂合体。

至此,DeepMind可以说在他们所需要的程度内,完成了对围棋(以及其他棋类)的探索,AlphaGo的技术将被用来解决其他领域的问题。

(3)三星杯辜梓豪夺冠升九,唐韦星遗憾输棋。


今天,中国围棋诞生了一位新的世界冠军,他也将直升九段。他就是98年出生的辜梓豪。辜梓豪比柯洁小半岁,中国棋坛也是世界棋界在将近4年后,终于出现了一位年纪比柯洁小的世界冠军。(注:并不是夺冠年龄比柯洁小)这意味着,围棋界在顶尖层次又有了新鲜的年轻血液。九八后正式登台了。

不过平心而论,这次三星杯的三盘棋质量都不高。第1局,本来是辜梓豪不错的棋,结果一个漏招,唐韦星反败为胜,捡了一盘;第2局,唐韦星胜利在望,然后鬼使神差地明明有连环劫却没走对,小辜捡了一盘,老唐赛后很是后悔。

第3局,也就是今天这一局,本来是唐韦星执黑稍有的局面,结果黑棋第121手误算了,被白121一顶,黑棋难以两全,按理只能在下边断吃白两子,干损2目棋。

如果这时候,唐九段冷静一点,就忍了,损2目其实局面并没有很差,均势,甚至黑棋还不坏,完全可下。结果素以心理素质好著称的唐韦星在大长考之后,忍耐不住,强行第123接住三子,就是不肯损2目。自此,万劫不复。后面打劫劫材不利,转换后再无机会。

这就是冲动的代价!

如果写这盘棋的棋评,可以拟两个正式一点的题目《小错尤可救,冲动难回头》、《九八辜自豪》。

如果想搞搞事情,大概《看淡胜负》、《还我三亿》(有些棋友应该知道这两个梗的出处)这两个标题就比较充满世界观的哲学思辨性,并略带淡淡的宗教隐喻的思考,尽管美中不足看起来有点像余秋雨老师的书名。滚滚长江东逝水,古今多少事,都付笑谈中。几度夕阳红,情深深雨濛濛,泡面加海苔,一切不过是从头再来。

(弈客编辑YK009)
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

返回列表