DDPG_TF2:KerasTensorflow 2中的简单深度确定性策略梯度算法(DDPG)实现源码

上传者：franchise25821 2021-03-14 03:33:00上传 ZIP文件 8.34KB 热度 143次

DDPG_TF2 很难在TF2中找到简单整洁的DDPG实现,因此我做了一个。 DDPG DDPG是一种无模型的非策略算法,可在连续动作空间中学习Q函数和策略。它受Deep Q Learning的启发,可以看作是连续acion空间上的DQN。它利用政策外数据和Bellman方程来学习Q函数,然后使用Q函数来推导和学习政策。在DDPG的此实现中,一开始执行n次纯探索(由rand_steps参数指定)。通过在整个范围内均匀分布来选择动作。主要特点: 随机(深度)模型估计可提供连续(无限)的动作空间。使用噪声过程(例如, Ornstein–Uhlenbeck过程)进行动作空间探索。使用经验重播可以稳定地学习以前的经验。演员和评论家结构在演员和评论家网络中使用目标模型(通过Polyak平均进行权重转移)。使用Bellman方程描述每对<状态,动作>的最佳q值函数。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

DDPG_TF2KerasTensorflow2中的简单深度确定性策略梯度算法DDPG实现源码

DDPG_TF2 很难在TF2中找到简单整洁的DDPG实现,因此我做了一个。 DDPG DDPG是一...

大小：8KB | 2021-03-14 03:33:00
pytorch ddpg利用PyTorch实现深度确定策略梯度DDPG的实现.zip

pytorch-ddpg, 利用PyTorch实现深度确定策略梯度( DDPG )的实现在 PyT...

大小：1.84MB | 2020-08-20 03:56:27
ddpg aigym具有深度强化学习的连续控制在OpenAI Gym环境中实现的深度确定性策略梯度DDPG算法源码

ddpg-aigym 深度确定性策略梯度 Tensorflow中深度确定性策略梯度算法的实现(Lil...

大小：322KB | 2021-04-23 02:30:56
DeepReinforcementLearning DDPGfor RoboticsControl这是名为深度确定性策略梯度DDPG的深度强化学习算法的

DDPGforRoboticsControl 这是名为深度确定性策略梯度(DDPG)的深度强化学习算...

大小：20.38MB | 2021-02-27 10:43:08
深度确定性策略梯度算法的Python实现

深度确定性策略梯度算法（Deep Deterministic Policy Gradient，简称D...

大小：7.14KB | 2023-07-04 02:58:55
确定性策略梯度算法简介

确定性策略梯度算法是一种在强化学习中广泛应用的方法。本文将介绍确定性策略梯度算法的基本原理和应用，包...

大小：335.61KB | 2023-10-14 17:01:52
论文研究优化深度确定性策略梯度算法.pdf

深度强化学习善于解决控制的优化问题，连续动作的控制因为精度的要求，动作的数量随着动作维度的增加呈指数...

大小：874KB | 2020-07-17 18:26:45
maddpg keras在Keras中实现多代理深度确定性策略梯度MADDPG算法源码

马迪克-凯拉斯在Keras中实现多代理深度确定性策略梯度(MADDPG)算法

大小：7.86MB | 2021-04-30 16:03:52
Multi Agent Deep Deterministic Policy Gradients多主体深度确定性策略梯度MADDPG算法的Pytorch实现

多代理深确定性策略梯度多主体深度确定性策略梯度(MADDPG)算法的Pytorch实现这是我在论...

大小：6KB | 2021-04-27 01:30:12
售电公司竞价策略研究：基于DDPG算法的深度强化学习

基于DDPG算法的深度强化学习在售电公司竞价策略研究中的应用。电力市场中，售电公司需要针对竞标和报价...

大小：353.6KB | 2023-07-29 02:11:15
框架确定性在深度学习框架中提供确定性源码

TensorFlow确定性这个主要的README当前专注于TensorFlow的GPU确定性。有...

大小：74KB | 2021-02-17 05:25:36
MATLAB实现DDPG算法在水箱控制中的应用

如何使用MATLAB编写代码实现DDPG算法在水箱控制中的应用。首先，我们详细讲解了DDPG算法的原...

大小：44.52KB | 2023-07-16 13:22:18
IPC DDPG UAV格式源码

IPC-DDPG-UAV格式

大小：3.19MB | 2021-03-02 16:32:45
增强型深度确定策略梯度算法

针对深度确定策略梯度算法收敛速率较慢的问题,提出了一种增强型深度确定策略梯度(E-DDPG)算法。该...

大小：1.07MB | 2021-01-16 22:28:25
DDPG连续控制源码

Unity带有RL的Reacher环境解决方案介绍该项目是用于解决Unity v0.4环境的深度...

大小：1.27MB | 2021-02-27 10:43:09
DDPG算法应用于售电公司竞价策略研究

本代码基于DDPG算法，对电力市场中的售电公司竞价策略进行研究，解决了传统RL算法的局限性，在不完全...

大小：355.9KB | 2024-04-30 07:26:41

DDPG_TF2:KerasTensorflow 2中的简单深度确定性策略梯度算法(DDPG)实现 源码

DDPG_TF2:KerasTensorflow 2中的简单深度确定性策略梯度算法(DDPG)实现源码