ai traineree:用于(深度)强化学习的PyTorch代理和工具 源码

上传:streak3981 浏览: 14 推荐: 0 文件:ZIP 大小:138.71KB 上传时间:2021-04-20 17:48:12 版权申诉
实习生 目的是建立一个深度强化学习方法的动物园,并展示它们在某些环境中的应用。 在文档中阅读更多信息: 。 为什么要另选一个? 主要原因是执行哲学。 我们坚信,代理应该出现在环境中,而不是相反。 大多数流行的实现都将环境实例传递给代理,就像代理是焦点一样。 这可能会简化某些算法的实现,但并不代表世界。 代理想要控制环境,但这并不意味着他们可以/应该。 那,然后使用PyTorch代替Tensorflow或JAX。 快速开始 要开始培训RL代理,您需要三件事:代理,环境和跑步者。 假设您要在OpenAI CartPole-v1上训练DQN代理: from ai_traineree.agents.dqn import DQNAgent from ai_traineree.env_runner import EnvRunner from ai_traineree.tasks impor
上传资源
用户评论