论文研究基于强化学习的无人坦克对战仿真研究.pdf

上传：oXiaoXiaoNiao40 浏览： 43 推荐： 0 文件：PDF 大小：737.91KB 上传时间：2020-04-29 06:04:28 版权申诉

对标准的强化学习进行改进，通过引入动机层，来引入先验知识，加快学习速度。策略迭代选择上，通过采用“同策略”迭代的Sarsa学习算法，代替传统的“异策略”Q学习算法。提出了基于多动机引导的Sarsa学习（MMSarsa）算法，分别和Q学习算法、Sarsa学习算法在坦克对战仿真问题上进行了三种算法的对比实验。实验结果表明，基于多动机引导的Sarsa学习算法收敛速度快且学习效率高。