1. 首页
  2. 数据库
  3. 其它
  4. Upside Down Reinforcement Learning:PyTorch中的颠倒强化学习(⅂ꓤ)实施。 基于JürgenSchmidhuber发表的

Upside Down Reinforcement Learning:PyTorch中的颠倒强化学习(⅂ꓤ)实施。 基于JürgenSchmidhuber发表的

上传者: 2021-04-20 15:56:14上传 ZIP文件 1.83MB 热度 19次
颠倒的强化学习 Pytorch中的颠倒强化学习(⅂ꓤ)实施。 基于JürgenSchmidhuber发表的论文: 该存储库包含一个离散动作空间以及一个针对OpenAI Gym CartPole环境(该环境的版本)的连续动作空间实现。 笔记本包括行为功能的培训以及评估部分,您可以在其中测试经过培训的行为功能。 用代理人在期望的时间范围内可以达到的期望的报酬来喂养它。 离散CartPole环境的图: 连续CartPole环境的图: LunarLander环境的图: 去做: 测试论文中提到的一些可能的改进(6.未来研究方向)。 作者 塞巴斯蒂安·迪特(Sebastian Dittert) 随意在您自己的项目或研究中使用此代码。 对于引用,请检查DOI或引用为: @misc{Upside-Down, author = {Dittert, Sebastian}, title
下载地址
用户评论