1. 首页
  2. 数据库
  3. 其它
  4. 多巴胺:多巴胺是用于强化学习算法的快速原型制作的研究框架 源码

多巴胺:多巴胺是用于强化学习算法的快速原型制作的研究框架 源码

上传者: 2021-02-06 12:32:30上传 ZIP文件 5.9MB 热度 4次
多巴胺 多巴胺是用于强化学习算法的快速原型制作的研究框架。 它旨在满足对小型,易处理的代码库的需求,用户可以在其中自由地试验荒诞的想法(投机研究)。 我们的设计原则是: 轻松进行实验:使新用户可以轻松进行基准实验。 灵活的开发:使新用户可以轻松尝试研究思路。 紧凑且可靠:提供一些经过战斗测试的算法的实现。 可重现:促进结果的可重现性。 特别是,我们的设置遵循的建议 。 本着这些原则的精神,第一个版本专注于支持适用于Atari 2600游戏的最先进的单GPU Rainbow代理( )( )。 。 具体来说,我们的Rainbow代理实现了确定为最重要的三个组件 : n步Be
用户评论