瞬间十二:
黑125在白棋铁桶中强行打入,127、129连靠死死缠住白棋。又是悲壮的手法。
“我偏要勉强!”
这个局部的变化对人类来说不难。(旁观者执白:“我有九种方法弄死他。”)然而白棋避开了各种更优解,选择了奇怪的下法送给了黑棋一个劫。然后又“巧妙”的脱先,让缓气劫变成了紧气劫。但黑棋劫财不够。
如果是人类在下,简直就像是博尔特在大幅度领先时跑到终点前停下来,等对手快赶上了才踏出最后一步,赤裸裸的调戏对手。但计算机没有这些非常规的“情绪与思维”。
AlphaGo在这个局部出现问题,和其他很多局部的非最优解一样,是为了选择“它自己认为胜率最高”的简明下法。用微软亚研院张峥老师的话说,可能AlphaGo还不擅长辨认在哪些局面下需要在局部“集中火力”。
本局中白32致胜的点(上上一个瞬间),据说就是在局部n*n集中火力之后的杰作,但那是前半盘。似乎越是接近终点,AlphaGo就越是倾向于不调用“集中火力”。
道理上似乎很容易理解,但是不是好也还很难讲。这说不定是下一阶段的改进方向。 |