Trust Region Policy Optimization PDF论文下载

上传:yk_wyw 浏览: 32 推荐: 0 文件:PDF 大小:952.29KB 上传时间:2019-09-25 15:32:34 版权申诉
TRPO算法的论文,是强化学习算法PPO、DPPO的基础,论文中对算法优化原理进行了比较详细的推导
上传资源
用户评论