ai traineree:用于(深度)强化学习的PyTorch代理和工具源码

上传：streak3981 浏览： 14 推荐： 0 文件：ZIP 大小：138.71KB 上传时间：2021-04-20 17:48:12 版权申诉

实习生目的是建立一个深度强化学习方法的动物园,并展示它们在某些环境中的应用。在文档中阅读更多信息: 。为什么要另选一个? 主要原因是执行哲学。我们坚信,代理应该出现在环境中,而不是相反。大多数流行的实现都将环境实例传递给代理,就像代理是焦点一样。这可能会简化某些算法的实现,但并不代表世界。代理想要控制环境,但这并不意味着他们可以/应该。那,然后使用PyTorch代替Tensorflow或JAX。快速开始要开始培训RL代理,您需要三件事:代理,环境和跑步者。假设您要在OpenAI CartPole-v1上训练DQN代理: from ai_traineree.agents.dqn import DQNAgent from ai_traineree.env_runner import EnvRunner from ai_traineree.tasks impor