DRL 2018:结合策略梯度方法(香草PGActor CriticPPO)和进化策略的实验源码

Name: DRL 2018:结合策略梯度方法(香草PGActor CriticPPO)和进化策略的实验 源码
Rating: 4.5 (20 reviews)
Author: qqseemingly85768

上传者：qqseemingly85768 2021-04-08 11:28:17上传 ZIP文件 15.41KB 热度 20次

DRL-2018 该存储库的功能是2018年夏季深度强化学习研究项目的工作(由Keith Ross教授建议,由纽约大学上海分校院长本科研究基金资助)。在此项目中,我们尝试将“策略梯度”方法(香草策略梯度(aka REINFORCE),Actor-Critic和PPO)与“进化策略”相结合,以设计出一种提高样本效率的混合算法。在MuJoCo基准上评估了所提出算法的性能。参考: 加强:罗纳德·J·威廉姆斯。用于连接符增强学习的简单统计梯度跟踪算法。机器学习,8(3-4):229–256,1992年。影评人:理查德·萨顿(Richard S Sutton),大卫·麦卡莱斯特(David A McAllester),萨特德·辛格(Satinder P Singh)和伊谢·曼苏(Yishay Mansour)。通过函数逼近进行强化学习的策略梯度方法。在《神经信息处理系统的进步

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

DRL2018结合策略梯度方法香草PGActor CriticPPO和进化策略的实验源码

DRL-2018 该存储库的功能是2018年夏季深度强化学习研究项目的工作(由Keith Ross教...

大小：15KB | 2021-04-08 11:28:17
进化策略算法

进化策略是一种比较少用的进化算法，但是它用起来更简洁方便，这里提供几种进化策略程序源代码。

大小：0B | 2020-05-23 11:46:04
组合进化方法遗传算法进化策略

无线移动计算中组合进化方法（CombinatorialEvolutionaryMethodsinwi...

大小：0B | 2020-05-14 09:59:36
进化策略算法C实现

大小：0B | 2019-03-01 11:07:31
miesmuschel灵活的混合整数进化策略源码

miesmuschel:混合整数进化策略项目状态尽管miesmuschel目前仍在发展,但已经可...

大小：240KB | 2021-04-24 02:18:13
基于小波分解和进化策略的图像融合方法

提出了一种基于小波分解和进化策略相结合的多聚焦图像融合方法。该方法首先对不同聚焦点图像进行无下采小波...

大小：2.51MB | 2021-03-01 03:39:28
Pareto存档进化策略算法(PAES)

大小：0B | 2018-12-08 08:11:16
Python使用进化策略玩FlappyBird游戏

使用进化策略玩FlappyBird游戏

大小：0B | 2020-06-17 16:51:55
论文研究量子克隆进化策略.pdf

量子克隆进化策略，李阳阳，焦李成，进化算法是解决优化问题的一种有效方法。但在实际应用中也存在着收敛速...

大小：0B | 2020-03-06 20:28:47
股票交易进化策略的元学习

元学习算法了解学习过程本身,因此可以用较少的数据和迭代来加快后续的类似学习任务。如果实现,这些好处...

大小：1022KB | 2020-08-17 02:44:56
基于进化策略的公交车调度.zip

声明:食用的时候,记得标明出处哦,尊重他人的劳动成果这些东西是我们的team一起弄出来哒,没有我的...

大小：2.49MB | 2020-08-21 08:09:50
进化策略算法公交车调度MATLAB

进化策略算法实现公交车调度，人工智能课程设计，自己原创，在MATLAB上调试通过

大小：0B | 2019-05-16 08:52:39
the theory of evolution strategies 学习进化策略不可少的书

大小：0B | 2019-03-16 18:05:36
VC实现的遗传算法双种群进化策略

VC编写的遗传算法，改进了以往的遗传算法，用双种群的进化策略对函数进行优化

大小：0B | 2019-07-13 13:51:45
一种并行免疫进化策略算法研究

基于克隆选择原理,提出一种自适应并行免疫进化策略.在算法中根据抗体抗原亲和度将初始抗体种群分为两个子...

大小：620KB | 2021-02-19 14:31:48
基于一维标定物和改进进化策略的相机标定

为了解决运动参数光电探测过程中的相机标定问题,制作一种两端及中间各安装一个红外反光标记球的一维标定物...

大小：3.37MB | 2021-02-23 03:40:57

DRL 2018:结合策略梯度方法(香草PGActor CriticPPO)和进化策略的实验 源码

DRL 2018:结合策略梯度方法(香草PGActor CriticPPO)和进化策略的实验源码