DeepReinforcementLearning DDPG for RoboticsControl:这是名为深度确定性策略梯度(DDPG)的深度强化学习算法的

Name: DeepReinforcementLearning DDPG for RoboticsControl:这是名为深度确定性策略梯度(DDPG)的深度强化学习算法的
Rating: 4.5 (60 reviews)
Author: presidency91240

上传者：presidency91240 2021-02-27 10:43:08上传 ZIP文件 20.38MB 热度 60次

DDPGforRoboticsControl 这是名为深度确定性策略梯度(DDPG)的深度强化学习算法的实现,用于训练4自由度机械臂以达到移动目标。动作空间是连续的,学习的代理会输出扭矩以使机器人移动到特定的目标位置。环境一个包含20个相同代理的,每个代理都有其自己的环境副本。在这种环境下,双臂可以移动到目标位置。对于代理人的手在目标位置中的每一步,将提供+0.1的奖励。因此,座席的目标是在尽可能多的时间步中保持其在目标位置的位置。观察空间由33个变量组成,分别对应于手臂的位置,旋转,速度和角速度。每个动作是一个带有四个数字的向量,对应于适用于两个关节的扭矩。动作向量中的每个条目都应为-1和1之间的数字。解决环境您的特工平均得分必须为+30(超过100个连续剧集,并且超过所有特工)。具体来说,在每个情节之后,我们将每个代理商获得的奖励加起来(不打折),以获得每个

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

DeepReinforcementLearning DDPGfor RoboticsControl这是名为深度确定性策略梯度DDPG的深度强化学习算法的

DDPGforRoboticsControl 这是名为深度确定性策略梯度(DDPG)的深度强化学习算...

大小：20.38MB | 2021-02-27 10:43:08
ddpg aigym具有深度强化学习的连续控制在OpenAI Gym环境中实现的深度确定性策略梯度DDPG算法源码

ddpg-aigym 深度确定性策略梯度 Tensorflow中深度确定性策略梯度算法的实现(Lil...

大小：322KB | 2021-04-23 02:30:56
DDPG_TF2KerasTensorflow2中的简单深度确定性策略梯度算法DDPG实现源码

DDPG_TF2 很难在TF2中找到简单整洁的DDPG实现,因此我做了一个。 DDPG DDPG是一...

大小：8KB | 2021-03-14 03:33:00
pytorch ddpg利用PyTorch实现深度确定策略梯度DDPG的实现.zip

pytorch-ddpg, 利用PyTorch实现深度确定策略梯度( DDPG )的实现在 PyT...

大小：1.84MB | 2020-08-20 03:56:27
售电公司竞价策略研究：基于DDPG算法的深度强化学习

基于DDPG算法的深度强化学习在售电公司竞价策略研究中的应用。电力市场中，售电公司需要针对竞标和报价...

大小：353.6KB | 2023-07-29 02:11:15
深度确定性策略梯度算法的Python实现

深度确定性策略梯度算法（Deep Deterministic Policy Gradient，简称D...

大小：7.14KB | 2023-07-04 02:58:55
DeepReinforcementLearning深度强化学习

DeepReinforcementLearning深度强化学习DeepReinforcementLe...

大小：0B | 2019-04-30 09:37:17
论文研究优化深度确定性策略梯度算法.pdf

深度强化学习善于解决控制的优化问题，连续动作的控制因为精度的要求，动作的数量随着动作维度的增加呈指数...

大小：874KB | 2020-07-17 18:26:45
DeepReinforcementLearning pytorch中的深度强化学习算法源码

DeepReinforcementLearning:pytorch中的深度强化学习算法!!

大小：26KB | 2021-05-12 11:55:35
确定性策略梯度算法简介

确定性策略梯度算法是一种在强化学习中广泛应用的方法。本文将介绍确定性策略梯度算法的基本原理和应用，包...

大小：335.61KB | 2023-10-14 17:01:52
DDPG智能体强化学习倒立摆案例

DDPG智能体强化学习倒立摆案例,Train DDPG Agent to Swing Up and ...

大小：545KB | 2021-01-30 07:06:17
深度强化学习的调度策略优化算法

Scheduling strategy optimization algorithm for dee...

大小：0B | 2019-06-23 00:51:52
框架确定性在深度学习框架中提供确定性源码

TensorFlow确定性这个主要的README当前专注于TensorFlow的GPU确定性。有...

大小：74KB | 2021-02-17 05:25:36
深度强化学习算法在MuJoCo机器人环境中的应用与比较（DDPG、TD3、SAC）

深度强化学习的 DDPG、TD3、SAC 这几套算法，放到 MuJoCo 环境里一跑，优劣立马就看出...

大小：643.26KB | 2025-06-10 08:48:36
深度强化学习

除了使徒直接去简历一个可以模拟承认大脑的程序之外，为什么不是图简历一个可以模拟小孩大脑的程序呢？如果...

大小：0B | 2019-07-11 03:33:58
maddpg keras在Keras中实现多代理深度确定性策略梯度MADDPG算法源码

马迪克-凯拉斯在Keras中实现多代理深度确定性策略梯度(MADDPG)算法

大小：7.86MB | 2021-04-30 16:03:52