pytorch a2c ppo acktr gail:PyTorch实施Advantage Actor Critic(A2C)近端策略优化(PPO)可扩展的信任

Name: pytorch a2c ppo acktr gail:PyTorch实施Advantage Actor Critic(A2C)近端策略优化(PPO)可扩展的信任
Rating: 4.5 (38 reviews)
Author: diffuse1201

上传者：diffuse1201 2021-02-06 11:17:50上传 ZIP文件 8.53MB 热度 38次

pytorch-a2c-ppo-acktr 请使用本自述文件中的超级参数。使用其他超级参数,可能无法正常工作(毕竟是RL)! 这是PyTorch的实现优势演员评论家(A2C), 的同步确定性版本最近策略优化使用Kronecker因子逼近可扩展信任域方法用于深度强化学习生成对抗模拟学习另请参阅OpenAI帖子: 和以获取更多信息。此实现受到 , 和的OpenAI基准的启发。由于对Atari游戏进行了很好的调整,因此它使用相同的超级参数和模型。如果要在出版物中引用此存储库,请使用此bibtex: @misc{pytorchrl, author = {Kostriko

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

pytorch a2c ppo acktr gail PyTorch实施Advantage Actor Critic A2C近端策略优化PPO可扩展的信任

pytorch-a2c-ppo-acktr 请使用本自述文件中的超级参数。使用其他超级参数,可能无...

大小：8.53MB | 2021-02-06 11:17:50
torchrl强化学习算法的Pytorch实现软演员评论员SAC DDPG TD3DQN A2C PPO TRPO源码

火炬RL RL方法的Pytorch实现支持具有连续和离散动作空间的环境。支持具有1d和3d观察空...

大小：170KB | 2021-02-01 22:30:48
imitation_learning PyTorch实现的一些强化学习算法优势演员评论A2C近距离策略优化PPO V MPO行为克隆BC将添加更

模仿学习此仓库包含一些强化学习算法的简单PyTorch实现: 优势演员评论家(A2C) 的同步变体...

大小：11.42MB | 2021-04-08 11:28:17
深度强化学习A2C算法实现

完整实现A2C算法，包括实现要点、模型构建、虚拟环境交互、模型训练、信息监控等，并亲测在google...

大小：0B | 2020-05-28 13:02:46
InverseRL GAIL VAIL On MuJoCo Pytorch GAIL VAIL实施源码

InverseRL-GAIL-VAIL-MuJoCo 火炬

大小：135.03MB | 2021-05-05 06:48:16
PPO源码

PPO

大小：1KB | 2021-03-20 11:04:12
PPO策略梯度算法文档

{"content": "使用强化学习中的PPO策略梯度算法，优化无人机的协调能力，实现高效目标搜索...

大小：5.64KB | 2025-01-20 14:33:35
pytorch lunarlander在月球着陆器中实现ppo算法源码

pytorch-lunarlander:在月球着陆器中,实现ppo算法

大小：5KB | 2021-03-20 11:04:05
stylegan2ada pytorch StyleGAN2ADA官方PyTorch实施源码

StyleGAN2-ADA —官方PyTorch实施用有限的数据训练生成对抗网络Tero Karr...

大小：1.12MB | 2021-04-30 21:53:08
DeepReinforcementLearning深度RL实施在pytorch中实现的DQNSACDDPGTD3PPO和VPG经过测试的环境Luna

使用Pytorch实现的深度RL算法算法列表: 关于深入探讨实验结果: 算法离散环境:Luna...

大小：391KB | 2021-02-26 06:55:38
PyTorch中的C++扩展实现

主要介绍了PyTorch中的C++扩展实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有...

大小：88KB | 2020-09-29 18:54:17
deepspeech2PyTorch实施的深度演讲2源码

deepspeech2 百度研究公司的Deep Speech 2模型于2015年发布,可将语音从文本...

大小：13KB | 2021-05-01 06:50:55
VAE pytorch VAE的pytorch实施源码

VAE-火炬 VAE和CVAE的Pytorch实施 VAE 为了生成某些东西,例如我们的mnist位...

大小：65.46MB | 2021-04-06 13:57:39
PyTorch2PyTorch入门张量

PyTorch | (1)初识PyTorch PyTorch | (2)PyTorch 入门-张量 ...

大小：156KB | 2021-01-17 01:27:29
actor critic public An Actor Critic Algorithm for Structured Prediction qu

actor-critic-public, "An Actor Critic Algorit...

大小：4.09MB | 2020-07-17 10:02:23
TRPO PPO解读.docx

内含原文(.pdf)加中文详细解读解读(.doc),主要是对openai与deepmind的算法,进...

大小：350KB | 2020-08-11 15:24:20