1. 首页
  2. 数据库
  3. 其它
  4. 车库:用于可重现强化学习研究的工具包 源码

车库:用于可重现强化学习研究的工具包 源码

上传者: 2021-04-04 18:00:35上传 ZIP文件 3.2MB 热度 23次
车库 garage是用于开发和评估强化学习算法的工具包,并且是使用该工具包构建的最新实现的随附库。 该工具包提供了用于实现RL算法的多种模块化工具,包括: 可组合神经网络模型 重播缓冲区 高性能采样器 富有表现力的实验定义界面 再现性工具(例如,设置所有组件均尊重的全局随机种子) 记录到许多输出,包括TensorBoard 可靠的实验检查点和恢复 许多流行基准套件的环境接口 支持在各种环境中运行车库,包括始终最新的Docker容器 请参阅以获取入门说明和详细的API。 安装 pip install --user garage 例子 从v2020.10.0版本开始,garage附带了示例
用户评论