CuriosityDriven PPO:通过引导功能松散的好奇心驱动探索源码

Name: CuriosityDriven PPO:通过引导功能松散的好奇心驱动探索 源码
Rating: 4.5 (30 reviews)
Author: embed23787

上传者：embed23787 2021-02-23 03:27:06上传 ZIP文件 124.61KB 热度 30次

通过引导功能来放松好奇心驱动的探索七月7,2018 描述此回购是对OpenAI的论文《一个松散的重述。该算法训练一种策略,使游戏完全摆脱内部预测错误产生的奖励。该过程可以可视化为策略和试图预测环境未来状态的模型(称为前向动力学模型)之间的决斗。该政策是通过培训的,除了将环境奖励替换为前向动力学模型的误差外。更具体地说,用于PPO的奖励是前向动力学模型的预测的平方误差。前向动力学模型的预测目标是环境中下一个状态的低维表示。这称为内在奖励。前向动力学模型越不准确,给定时间步长的奖励就越大。这鼓励了政策寻求看不见的状态,并创建了一个强大的预测系统。实施说明此实现不包括Hin

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

CuriosityDriven PPO通过引导功能松散的好奇心驱动探索源码

通过引导功能来放松好奇心驱动的探索七月7,2018 描述此回购是对OpenAI的论文《一个松散的...

大小：125KB | 2021-02-23 03:27:06
好奇心日报1.3

提供商：北京酷睿奥思科技发展有限公司软件大小：11.49M软件授权：免费更新：2014-12-26语...

大小：0B | 2019-09-15 08:38:52
webrtc for the curious WebRTC的好奇心源码

欢迎来到WebRTC以求好奇! 这本书是什么。直接从GitHub或在开始阅读这本书当我们向社交媒...

大小：239KB | 2021-03-13 22:50:53
好奇心查找惊人的Github项目源码

好奇心产品特点查找出色的github项目作为提要。 :high_voltage: :high_v...

大小：118KB | 2021-02-01 22:52:49
swiftJFQDaily高仿好奇心日报

JFQDaily高仿好奇心日报

大小：0B | 2019-09-04 05:40:40
Flutter高仿好奇心日报

Flutter高仿好奇心日报

大小：0B | 2019-09-04 05:40:41
偷看好奇心的测试框架cat源码

偷看:好奇心的测试框架:cat:

大小：700KB | 2021-02-09 18:29:40
iosJFQDaily仿酷好奇心日报.zip

高仿好奇心日报，pop实现弹簧动画效果，动态设置UITableViewCell，无限轮播器！

大小：0B | 2019-09-15 08:38:55
noreward rl ICML2017TensorFlow代码用于好奇心驱动的深度强化学习探索源码

自我监督预测的好奇心驱动探索在ICML 2017中 , , ,加州大学伯克利分校这是我们基于IC...

大小：2.04MB | 2021-02-09 05:27:39
pico8PICO8游戏和好奇心源码

pico8:PICO-8游戏和好奇心

大小：5KB | 2021-02-07 20:51:25
一种新颖的好奇心驱动的知觉行为认知模型

一种新颖的好奇心驱动的知觉行为认知模型

大小：165KB | 2021-04-26 06:49:25
知觉行动循环中好奇心驱动的内在动机认知模型

知觉-行动循环中好奇心驱动的内在动机认知模型

大小：339KB | 2021-04-26 06:49:29
5篇高中作文论好奇心800字.doc

5篇高中作文论好奇心800字在成长中,我总会对这对那而好奇,是它驱使着我对外界事物的热情与向往...

大小：19KB | 2020-12-23 19:40:47
eurekacast科学与技术相遇您与您相遇激发好奇心源码

播客播放器播客RSS Feed: :

大小：1.46GB | 2021-05-02 00:54:22
激发零售商的好奇心和消费者体验

如今,零售商必须尝试通过消费者的购物体验使其与竞争对手区分开来。作者区分了几个体验维度,并开发了一...

大小：336KB | 2020-08-30 05:12:34
Curiosity_Driven_Learning_2021_diplom这是一个研究好奇心驱动学习方法的项目源码

好奇心_Driven_Learning_2021_diplom 这是一个检查好奇心驱动学习方法的项目...

大小：7KB | 2021-04-06 01:37:21

CuriosityDriven PPO:通过引导功能松散的好奇心驱动探索 源码

CuriosityDriven PPO:通过引导功能松散的好奇心驱动探索源码