alphago原理解析

上传：lanql 浏览： 34 推荐： 0 文件：PDF 大小：12.56MB 上传时间：2019-07-13 14:50:26 版权申诉

AlphaGo的学习依赖于深度学习DeepLearning和增强学习ReinforcementLearning，合起来就是DeepReinforcementLearning。这实际上当前人工智能界最前沿的研究方向。关于深度学习和增强学习，本文不做详细的介绍。深度神经网络是由巨量的参数形成的一个多层的神经网络，输入某一种类型的数据，输出某一种特定的结果，根据输出的误差，计算并更新神经网络的参数，从而减少误差，从而使得利用神经网络，特定的输入可以得到特定想要的结果。以深度模拟“脑”为例。这个实际上是一个12层的神经网络。输入主要是整个棋盘的19*19的信息（比如黑棋的信息，白棋的信息，空着的信息，还有其他一些和围棋规则有关的信息一共48种）。输出要