trpo:使用TensorFlow和OpenAI Gym优化信任区域策略源码

Name: trpo:使用TensorFlow和OpenAI Gym优化信任区域策略 源码
Rating: 4.5 (56 reviews)
Author: qqfulfilment3735

上传者：qqfulfilment3735 2021-03-01 00:42:41上传 ZIP文件 637.37KB 热度 56次

广义优势估计的信任域策略优化帕特里克·科迪(Patrick Coady): 概要注意:代码已重构为使用TensorFlow 2.0和PyBullet(而不是MuJoCo)。请参阅tf1_mujoco分支以获取旧版本。该项目的最初目标是使用相同的算法来“解决” 。并且,具体地说,要在不手动调整每个环境的超参数(网络大小,学习速率和TRPO设置)的情况下实现此目的。这是具有挑战性的,因为环境的范围从具有单个控制输入的简单手推车杆问题到具有17个受控关节和44个观察变量的类人动物。该项目成功完成,几乎在所有AI Gym MuJoCo排行榜上都位居榜首。随着TensorFlow 2

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

trpo使用TensorFlow和OpenAI Gym优化信任区域策略源码

广义优势估计的信任域策略优化帕特里克·科迪(Patrick Coady): 概要注意:代码已重构...

大小：637KB | 2021-03-01 00:42:41
OpenAI gym

在下载gym并安装完成后，可通过上述代码测试，python的版本要求3.5.x以上，运行python...

大小：0B | 2020-05-31 18:29:07
OpenAI Gym Car Race自驾车OpenAI Gym环境源码

OpenAI健身车比赛一个OpenAI Gym环境,用于模拟赛道上的自动驾驶汽车。专为。该项目...

大小：102KB | 2021-04-07 12:07:47
PythonPyTorch实现TrustRegionPolicyOptimization信任区域策略优化算法

PyTorch实现(TrustRegionPolicyOptimization,信任区域策略优化)算...

大小：0B | 2019-09-03 03:03:23
Gym scarecrow SCAREcrow项目的OpenAI Gym环境源码

健身房的稻草人适用于SCAREcrow项目的OpenAI Gym环境。

大小：6.55MB | 2021-02-08 08:09:42
OPENAI GYM强化学习问题源码

OPENAI健身房强化学习问题

大小：2KB | 2021-04-08 11:34:45
flappy bird gym Flappy Bird游戏的OpenAI Gym环境源码

OpenAI体育馆的飞扬的小鸟该存储库包含用于Flappy Bird游戏的OpenAI Gym环境...

大小：6.5MB | 2021-02-08 05:24:02
强化学习OpenAI Gym环境理解和显示

强化学习——OpenAI Gym——环境理解和显示本文以CartPole为例。新建Python文...

大小：39KB | 2021-01-03 15:50:42
gym cryptotrading基于OpenAI Gym Environment API的比特币交易环境源码

健身房加密交易环境基于Gym Environment API的比特币交易模拟器,具有连续观察空间和...

大小：15KB | 2021-04-08 11:34:42
Deep Reinforcement Learning With Python使用OpenAI Gym和TensorFlow结合广泛的数学知识来掌握经典RL深

使用OpenAI Gym和TensorFlow结合广泛的数学知识来掌握经典RL,深度RL,分布式RL...

大小：24.65MB | 2021-04-27 01:37:00
OpenAIGym使用OpenAI的Gym API进行强化学习练习源码

OpenAIGym练习可以提高我的RL技能。这是我与TAMU CESG一起进行的本科研究工作的一部...

大小：8KB | 2021-04-08 20:29:17
openAI gym配套的软件包

安装openAI的gym进行强化学习时，经常会遇到需要安装Box2D的情况，本资源为其Linux（U...

大小：0B | 2019-09-26 12:05:49
Breakout RL使用带有CNN的DQN解决OpenAI Gym Env突破源码

Breakout-RL:使用带有CNN的DQN解决OpenAI Gym Env突破

大小：5KB | 2021-02-22 16:04:46
TensorFlow模型的Java部署和优化策略

TensorFlow是业界广泛使用的开源深度学习框架之一，它提供了灵活可扩展的平台用于构建和训练机器...

大小：19.85KB | 2023-08-26 15:33:21
rex gym适用于开源四足机器人SpotMicro的OpenAI Gym环境源码

Rex:一个开源的四足机器人该项目的目标是训练一个开源3D打印四足机器人,探索Reinforcem...

大小：117.44MB | 2021-02-24 16:20:23
gym d2d设备到设备D2D通信OpenAI Gym环境源码

GymD2D:设备到设备(D2D)底层蜂窝卸载评估平台 GymD2D是用于构建,评估和比较D2D蜂窝...

大小：27KB | 2021-04-19 10:21:49

trpo:使用TensorFlow和OpenAI Gym优化信任区域策略 源码

trpo:使用TensorFlow和OpenAI Gym优化信任区域策略源码