1. 首页
  2. 数据库
  3. 其它
  4. rllab 微调 源码

rllab 微调 源码

上传者: 2021-02-23 23:50:45上传 ZIP文件 1.65MB 热度 11次
实验室 分层强化学习的子策略适应 要运行针对“分层强化学习的子策略调整”的论文的实验,请导航至sandbox/finetuning/README.md以查看说明。 引用子策略适应以进行分层强化学习 如果您将我们的代码用于学术研究,强烈建议您引用以下文章: 亚历山大·李(Alex C. “。”。 2020年第八届国际学习代表大会(ICLR)会议录。 贷记项目代码 我们以原始rllab代码以及由 (UC Berkeley / Covariant)开发的代码为。 (加州大学伯克利分校/ CMU)是该项目的主要开发商。 实验室 rllab是用于开发和评估强化学习算法的框架。 它包括各种各样的连续
下载地址
用户评论