阅读历史 |

598.请你做一个不讲武德的大师(第10章) (第1/8页)

加入书签

在此前的版本中,博米围棋大师用到了“策略网络”来选择下一步棋的走法,以及使用“价值网络”来预测每一步棋后的赢家。而在新的版本中,这两个神经网络合二为一,从而让它能得到更高效的训练和评估。

博米围棋并不使用快速、随机的走子方法。在此前的版本中,博米围棋大师用的是快速走子方法,来预测哪个玩家会从当前的局面中赢得比赛。

相反,新版本依靠地是其高质量的神经网络来评估下棋的局势。

现在“博米围棋大师是通过两个不同神经网络“大脑”合作来改进下棋。

这些“大脑”是多层神经网络,跟那些图片搜索引擎识别图片在结构上是相似的。

刘光然和曹阳站在观察房里面看着对面的棋手们正在陷入痛苦的挣扎之中,在小黑屋里面,摆放着许多的显示器,上面正在演示着棋手和电脑的对弈局面。

曹阳看了一眼,表示自己看不明白,反正最后只要能看得出谁输谁赢就可以了。

“我们最开始的围棋算法,就是从神经网络和深度学习入手,然后通过往数据库当中输入大量的对弈局势,之后从这些对局当中进行学习,来找到更加适合的方法。”刘光然对曹阳说,“当时的这一套方案还是取得了不错的

↑返回顶部↑

书页/目录