增强型深度确定策略梯度算法

Name: 增强型深度确定策略梯度算法
Rating: 4.5 (46 reviews)
Author: tonydin

上传者：tonydin 2021-01-16 22:28:25上传 PDF文件 1.07MB 热度 46次

针对深度确定策略梯度算法收敛速率较慢的问题,提出了一种增强型深度确定策略梯度(E-DDPG)算法。该算法在深度确定策略梯度算法的基础上,重新构建两个新的样本池——多样性样本池和高误差样本池。在算法执行过程中,训练样本分别从多样性样本池和高误差样本池按比例选取,以兼顾样本多样性以及样本价值信息,提高样本的利用效率和算法的收敛性能。此外,进一步从理论上证明了利用自模拟度量方法对样本进行相似性度量的合理性,建立值函数与样本相似性之间的关系。将E-DDPG算法以及DDPG算法用于经典的Pendulum问题和MountainCar问题,实验结果表明,E-DDPG具有更好的收敛稳定性,同时具有更快的收敛速

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

增强型深度确定策略梯度算法

针对深度确定策略梯度算法收敛速率较慢的问题,提出了一种增强型深度确定策略梯度(E-DDPG)算法。该...

大小：1.07MB | 2021-01-16 22:28:25
深度确定性策略梯度算法的Python实现

深度确定性策略梯度算法（Deep Deterministic Policy Gradient，简称D...

大小：7.14KB | 2023-07-04 02:58:55
增强型区间二型FCM算法

不确定性存在于图像处理、模式识别等众多领域的实际应用中, 模糊?? 均值聚类(FCM) 算法虽广泛应...

大小：378KB | 2021-01-16 10:48:29
论文研究优化深度确定性策略梯度算法.pdf

深度强化学习善于解决控制的优化问题，连续动作的控制因为精度的要求，动作的数量随着动作维度的增加呈指数...

大小：874KB | 2020-07-17 18:26:45
确定性策略梯度算法简介

确定性策略梯度算法是一种在强化学习中广泛应用的方法。本文将介绍确定性策略梯度算法的基本原理和应用，包...

大小：335.61KB | 2023-10-14 17:01:52
增强型CTreeCtrl

可以实现多项选择，基于mfc的treectrl开发

大小：0B | 2018-12-20 21:08:42
增强型MCDC

单元测试中的MCDC,增强型MCDC的处理

大小：1.3MB | 2020-08-23 01:23:57
增强型冗余系统

ControlLogix增强型冗余系统

大小：0B | 2019-09-06 08:48:42
增强型Treeview控件

大小：0B | 2019-02-23 15:57:12
ID增强型脚注

ID增强型脚注cs2_cs3_cs4ID加角注ID角注圈码INDESIGN角注圈码

大小：0B | 2019-07-25 09:29:00
鼠标增强型软件

发现一块很好的小软件，鼠标增强型软件，Protell99中不能通过鼠标滚轮进行放大缩小，既不方便，这...

大小：0B | 2019-07-19 11:56:53
Excel增强型插件

大小：0B | 2019-02-17 21:42:20
增强型虚拟寄存器轮转算法

为了对抗基于数据流逆向分析的语义攻击,以虚拟寄存器为切入点,提出了一种增强型虚拟寄存器轮转算法。该算...

大小：622KB | 2021-04-07 03:30:38
delphi是增强型TExcel

作者:StefanHoffmeister.T(Adv)Excel是增强型TExcel,支持Excel...

大小：0B | 2020-02-04 16:39:51
增强型计算器

大小：0B | 2019-01-12 12:39:46
增强型多人游戏源码

增强型多人游戏所有这些就是增强多人游戏体验。去做一切已完成没有

大小：56KB | 2021-02-21 01:50:12