mbpo_pytorch:基于模型的强化学习算法MBPO的pytorch复制 源码

上传:counselor_16997 浏览: 13 推荐: 0 文件:ZIP 大小:172KB 上传时间:2021-04-04 18:00:23 版权申诉
概述 这是pytorch中基于模型的RL算法MBPO的重新实现,如下文所述:。 该代码基于的使用张量流集成模型重现了结果,但使用pytorch集成模型却表现出明显的性能下降。 这段代码使用pytorch重新实现了集成动力学模型,并缩小了差距。 转载结果 比较是在两个任务上完成的,而其他任务没有经过测试。 但是在经过测试的两个任务上,与官方的tensorflow代码相比,pytorch实现获得了类似的性能。 依存关系 MuJoCo 1.5和MuJoCo 2.0 用法 python main_mbpo.py --env_name'Walker2d-v2'--num_epoch 300 --model_type'pytorch' python main_mbpo.py --env_name'Hopper-v2'--num_epoch 300 --model_type'pytorch' 参考
上传资源
用户评论