1. 首页
  2. 数据库
  3. 其它
  4. noreward rl:[ICML 2017] TensorFlow代码用于好奇心驱动的深度强化学习探索 源码

noreward rl:[ICML 2017] TensorFlow代码用于好奇心驱动的深度强化学习探索 源码

上传者: 2021-02-09 05:27:39上传 ZIP文件 2.04MB 热度 10次
自我监督预测的好奇心驱动探索 在ICML 2017中 , , ,加州大学伯克利分校 这是我们基于ICLS 基于张量流的实现,该。 当来自环境的外部奖励稀疏时,想法是用内在的基于好奇心的动机(ICM)来培训代理商。 令人惊讶的是,即使环境中没有可用的奖励,您也可以使用ICM,在这种情况下,代理仅出于好奇而学会探索:“没有奖励的RL”。 如果您发现这项工作对您的研究有用,请引用: @inproceedings{pathakICMl17curiosity, Author = {Pathak, Deepak and Agrawal, Pulkit and Ef
下载地址
用户评论