Multi Agent Deep Deterministic Policy Gradients:多主体深度确定性策略梯度(MADDPG)算法的Pytorch实现

Name: Multi Agent Deep Deterministic Policy Gradients:多主体深度确定性策略梯度(MADDPG)算法的Pytorch实现
Rating: 4.5 (75 reviews)
Author: qqrubbish75

上传者：qqrubbish75 2021-04-27 01:30:12上传 ZIP文件 6.02KB 热度 75次

多代理深确定性策略梯度多主体深度确定性策略梯度(MADDPG)算法的Pytorch实现这是我在论文中提出的算法的实现:“针对混合合作竞争环境的多主体Actor评论家”。您可以在这里找到本文: : 您将需要安装多代理粒子环境(MAPE),可以在这里找到: : 确保创建具有MAPE依赖项的虚拟环境,因为它们有些过时了。我还建议使用PyTorch 1.4.0版运行此程序,因为最新版本(1.8)似乎与我在计算批评者损失时使用的就地操作存在问题。将主存储库克隆到与MAPE相同的目录中可能是最容易的,因为主文件需要该软件包中的make_env函数。可以在以下位置找到本教程的视频: :

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

Multi Agent Deep Deterministic Policy Gradients多主体深度确定性策略梯度MADDPG算法的Pytorch实现

多代理深确定性策略梯度多主体深度确定性策略梯度(MADDPG)算法的Pytorch实现这是我在论...

大小：6KB | 2021-04-27 01:30:12
maddpg keras在Keras中实现多代理深度确定性策略梯度MADDPG算法源码

马迪克-凯拉斯在Keras中实现多代理深度确定性策略梯度(MADDPG)算法

大小：7.86MB | 2021-04-30 16:03:52
深度确定性策略梯度算法的Python实现

深度确定性策略梯度算法（Deep Deterministic Policy Gradient，简称D...

大小：7.14KB | 2023-07-04 02:58:55
确定性策略梯度算法简介

确定性策略梯度算法是一种在强化学习中广泛应用的方法。本文将介绍确定性策略梯度算法的基本原理和应用，包...

大小：335.61KB | 2023-10-14 17:01:52
论文研究优化深度确定性策略梯度算法.pdf

深度强化学习善于解决控制的优化问题，连续动作的控制因为精度的要求，动作的数量随着动作维度的增加呈指数...

大小：874KB | 2020-07-17 18:26:45
pytorch ddpg利用PyTorch实现深度确定策略梯度DDPG的实现.zip

pytorch-ddpg, 利用PyTorch实现深度确定策略梯度( DDPG )的实现在 PyT...

大小：1.84MB | 2020-08-20 03:56:27
DeepReinforcementLearning DDPGfor RoboticsControl这是名为深度确定性策略梯度DDPG的深度强化学习算法的

DDPGforRoboticsControl 这是名为深度确定性策略梯度(DDPG)的深度强化学习算...

大小：20.38MB | 2021-02-27 10:43:08
DDPG_TF2KerasTensorflow2中的简单深度确定性策略梯度算法DDPG实现源码

DDPG_TF2 很难在TF2中找到简单整洁的DDPG实现,因此我做了一个。 DDPG DDPG是一...

大小：8KB | 2021-03-14 03:33:00
增强型深度确定策略梯度算法

针对深度确定策略梯度算法收敛速率较慢的问题,提出了一种增强型深度确定策略梯度(E-DDPG)算法。该...

大小：1.07MB | 2021-01-16 22:28:25
框架确定性在深度学习框架中提供确定性源码

TensorFlow确定性这个主要的README当前专注于TensorFlow的GPU确定性。有...

大小：74KB | 2021-02-17 05:25:36
ddpg aigym具有深度强化学习的连续控制在OpenAI Gym环境中实现的深度确定性策略梯度DDPG算法源码

ddpg-aigym 深度确定性策略梯度 Tensorflow中深度确定性策略梯度算法的实现(Lil...

大小：322KB | 2021-04-23 02:30:56
带有MADDPG的网球在Pytorch上实现MADDPG源码

项目3:合作与竞争介绍在这种环境下,两名特工控制球拍在球网上弹跳球。如果探员将球击中网,则得到...

大小：45.93MB | 2021-02-21 02:51:03
确定性跳跃表java实现

确定性跳跃表，java语言实现，实现了详细的跳跃表操作和功能

大小：0B | 2018-12-21 11:48:58
债券投资策略：追求确定性，稳健前行

本策略文档详细探讨了当前债券市场的投资机会与风险，并提出了以把握确定性为核心的投资思路。内容强调在复...

大小：1.7MB | 2024-05-12 12:49:28
数学确定性的丧失

人类对于宇宙以及数学地位的认识已被迫作出了根本性的改变,本书要讨论的正是这一点。现在我们知道,数学...

大小：658KB | 2020-09-17 04:28:57
Python深度增强学习算法的PyTorch实现策略梯度生成对抗模仿学习

深度增强学习算法的PyTorch实现(策略梯度/生成对抗模仿学习)

大小：0B | 2020-06-14 15:15:33