driver_critic:OpenAI Gym的CarRacing v0环境解决方案。它使用深度确定性策略梯度算法源码

Name: driver_critic:OpenAI Gym的CarRacing v0环境解决方案。它使用深度确定性策略梯度算法 源码
Rating: 4.5 (129 reviews)
Author: diffuse1201

上传者：diffuse1201 2021-04-08 11:28:05上传 ZIP文件 377.41KB 热度 129次

司机批评家 OpenAI Gym的CarRacing-v0环境解决方案。它使用DDPG算法(深度确定性策略梯度)。快速开始依存关系: 健身房0.18.0 Tensorflow 2.4.0 Matplotlib 3.3.4 当前版本的CarRacing-v0存在内存错误。为了解决这个问题,我们需要从Gym GitHub手动下载最新的“ car_racing.py”脚本。正在运行的应用程序: 执行“ main_loop.py”以训练新模型。按空格键观看进度可以通过运行“ evaluate_loop.py”来检查最佳解决方案。解决方案 DDPG由4个网络组成: 演员-玩游戏评论家-评估演员目标演员和目标评论家-产生学习目标值参考: : 它旨在创建一个基类,它将成为每个连续动作任务的基础。通过继承基类,可以轻松实现更复杂的解决方案。 CarRacing-v0是一种计算机视

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

driver_critic OpenAI Gym的CarRacing v0环境解决方案它使用深度确定性策略梯度算法源码

司机批评家 OpenAI Gym的CarRacing-v0环境解决方案。它使用DDPG算法(深度确定...

大小：377KB | 2021-04-08 11:28:05
深度确定性策略梯度算法的Python实现

深度确定性策略梯度算法（Deep Deterministic Policy Gradient，简称D...

大小：7.14KB | 2023-07-04 02:58:55
确定性策略梯度算法简介

确定性策略梯度算法是一种在强化学习中广泛应用的方法。本文将介绍确定性策略梯度算法的基本原理和应用，包...

大小：335.61KB | 2023-10-14 17:01:52
ddpg aigym具有深度强化学习的连续控制在OpenAI Gym环境中实现的深度确定性策略梯度DDPG算法源码

ddpg-aigym 深度确定性策略梯度 Tensorflow中深度确定性策略梯度算法的实现(Lil...

大小：322KB | 2021-04-23 02:30:56
论文研究优化深度确定性策略梯度算法.pdf

深度强化学习善于解决控制的优化问题，连续动作的控制因为精度的要求，动作的数量随着动作维度的增加呈指数...

大小：874KB | 2020-07-17 18:26:45
DRL_OpenAI CartPole v0OpenAI CartPole v0基于DeepRL的解决方案源码

基于OpenAI CartPole-v0 DeepRL的解决方案使用深度Q网络(DQN),决斗DQ...

大小：9.81MB | 2021-03-24 01:37:03
基于CartPole v0环境的强化学习算法实现

Cart Pole在OpenAI的gym模拟器里面是相对比较简单的一个游戏.游戏里面有一个小车上有一...

大小：3MB | 2023-01-21 03:53:17
maddpg keras在Keras中实现多代理深度确定性策略梯度MADDPG算法源码

马迪克-凯拉斯在Keras中实现多代理深度确定性策略梯度(MADDPG)算法

大小：7.86MB | 2021-04-30 16:03:52
DeepReinforcementLearning DDPGfor RoboticsControl这是名为深度确定性策略梯度DDPG的深度强化学习算法的

DDPGforRoboticsControl 这是名为深度确定性策略梯度(DDPG)的深度强化学习算...

大小：20.38MB | 2021-02-27 10:43:08
DDPG_TF2KerasTensorflow2中的简单深度确定性策略梯度算法DDPG实现源码

DDPG_TF2 很难在TF2中找到简单整洁的DDPG实现,因此我做了一个。 DDPG DDPG是一...

大小：8KB | 2021-03-14 03:33:00
框架确定性在深度学习框架中提供确定性源码

TensorFlow确定性这个主要的README当前专注于TensorFlow的GPU确定性。有...

大小：74KB | 2021-02-17 05:25:36
OpenAI Gym Car Race自驾车OpenAI Gym环境源码

OpenAI健身车比赛一个OpenAI Gym环境,用于模拟赛道上的自动驾驶汽车。专为。该项目...

大小：102KB | 2021-04-07 12:07:47
Multi Agent Deep Deterministic Policy Gradients多主体深度确定性策略梯度MADDPG算法的Pytorch实现

多代理深确定性策略梯度多主体深度确定性策略梯度(MADDPG)算法的Pytorch实现这是我在论...

大小：6KB | 2021-04-27 01:30:12
增强型深度确定策略梯度算法

针对深度确定策略梯度算法收敛速率较慢的问题,提出了一种增强型深度确定策略梯度(E-DDPG)算法。该...

大小：1.07MB | 2021-01-16 22:28:25
Gym scarecrow SCAREcrow项目的OpenAI Gym环境源码

健身房的稻草人适用于SCAREcrow项目的OpenAI Gym环境。

大小：6.55MB | 2021-02-08 08:09:42
Lunar_project Gym.openai.comenvsLunarLander v2的解决方案源码

Lunar_project gym.openai.com/envs/LunarLander-v2的解...

大小：178KB | 2021-04-25 01:59:55

driver_critic:OpenAI Gym的CarRacing v0环境解决方案。它使用深度确定性策略梯度算法 源码

driver_critic:OpenAI Gym的CarRacing v0环境解决方案。它使用深度确定性策略梯度算法源码