黑暗森林是 Facebook AI Research 的两位华人研究者共同完成的人工智能围棋程序,命名来自刘慈欣的《三体II:黑暗森林》。田渊栋博士自己在知乎上谦虚的说 (原话),要是 DeepMind 决定在2015年10月份战胜樊麾后马上公开,或者他自己再拖一会儿,决定不投ICLR 而等到2016年的 ICML,那就被灭得连渣都不剩了。如果把科研者的虚怀若谷先放一边的话,人工智能的日新月异也可见一斑。
训练估值网络有一个小窍门。如果把同一盘棋的每一步局面都当作输入训练的话,因为每两个相邻的棋局都只差一颗棋子,相关性很高,所以很容易造成过拟合的问题。作者就让机器自己生成3000万个不同的棋局,每个棋局都属于一盘不同的棋。训练后的估值网络比采用快速蒙特卡洛推演( Monte-Carlo rollouts with fast policy) 要准确,同时可以达到一般蒙特卡洛推演的准确度,但是要快15000倍。