mbpo_pytorch:基于模型的强化学习算法MBPO的pytorch复制源码

上传：counselor_16997 浏览： 13 推荐： 0 文件：ZIP 大小：172KB 上传时间：2021-04-04 18:00:23 版权申诉

概述这是pytorch中基于模型的RL算法MBPO的重新实现,如下文所述:。该代码基于的使用张量流集成模型重现了结果,但使用pytorch集成模型却表现出明显的性能下降。这段代码使用pytorch重新实现了集成动力学模型,并缩小了差距。转载结果比较是在两个任务上完成的,而其他任务没有经过测试。但是在经过测试的两个任务上,与官方的tensorflow代码相比,pytorch实现获得了类似的性能。依存关系 MuJoCo 1.5和MuJoCo 2.0 用法 python main_mbpo.py --env_name'Walker2d-v2'--num_epoch 300 --model_type'pytorch' python main_mbpo.py --env_name'Hopper-v2'--num_epoch 300 --model_type'pytorch' 参考

上传资源

mbpo_pytorch:基于模型的强化学习算法MBPO的pytorch复制 源码

mbpo_pytorch:基于模型的强化学习算法MBPO的pytorch复制源码