598.请你做一个不讲武德的大师(第10章) (第3/8页)
来,难以置信地看着刘光然。
这是个什么鬼啊?!
也就是说,你现在已经没有让它学习棋谱了?
那它怎么战胜那些职业棋手啊?!
我特么还想要让我们的围棋大师好好地战一战世界冠军,一战立威来着。
刘光然耐心地解释到,“我之前不是说了吗?我们改进的新方案,是让博米围棋大师有两个大脑。
它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。
第一大脑:落子选择器
博米围棋大师的第一个神经网络大脑是“监督学习的策略网络”,观察棋盘布局企图找到最佳的下一步。
事实上,它预测每一个合法下一步的最佳概率,那么最前面猜测的就是那个概率最高的。这可以理解成“落子选择器”。
第二大脑叫做,棋局评估器。博米围棋大师的第二个大脑相对于落子选择器是回答另一个问题,它不是去猜测具体下一步,而是在给定棋子位置情况下,预测每一个棋手赢棋的概率。
这“局面评估器”就是“价值网络”
↑返回顶部↑