基于可中断Option的在线分层强化学习方法

上传者：qingyue19709 2021-01-16 23:04:03上传 PDF文件 917KB 热度 15次

针对大数据体量大的问题,在Macro-Q算法的基础上提出了一种在线更新的Macro-Q算法(MQIU),同时更新抽象动作的值函数和元动作的值函数,提高了数据样本的利用率。针对传统的马尔可夫过程模型和抽象动作均难于应对可变性,引入中断机制,提出了一种可中断抽象动作的Macro-Q无模型学习算法(IMQ),能在动态环境下学习并改进控制策略。仿真结果验证了MQIU算法能加快算法收敛速度,进而能解决更大规模的问题,同时也验证了IMQ算法能够加快任务的求解,并保持学习性能的稳定性。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

基于可中断Option的在线分层强化学习方法

针对大数据体量大的问题,在Macro-Q算法的基础上提出了一种在线更新的Macro-Q算法(MQIU...

大小：917KB | 2021-01-16 23:04:03
分层强化学习

分层强化学习MAXQ文档，有助于对分层强化学习MAXQ的理解

大小：0B | 2019-05-20 17:36:16
分层强化学习综述

强化学习(reinforcement learning) 是机器学习和人工智能领域的重要分支,近年来...

大小：121KB | 2021-04-19 17:20:09
Python强化学习方法和教程

强化学习方法和教程

大小：0B | 2020-06-17 16:36:21
多智能体机器学习强化学习方法

大小：0B | 2019-01-14 01:00:57
高效探索：强化学习方法的深入研究

强化学习作为机器学习的重要分支，扮演着实现通用人工智能的关键角色。与其他机器学习方法的不同之处在于，...

大小：19.06MB | 2023-11-29 12:29:39
论文研究基于强化学习方法的访存调度算法.pdf

在现代处理器中，存储控制器是处理器芯片对片外存储器进行访问的管理者和执行者，其中对访存过程的调度算法...

大小：0B | 2020-01-04 18:45:07
基于重抽样优选缓存经验回放机制的深度强化学习方法

针对深度强化学习算法中经验缓存机制构建问题,提出一种基于TD误差的重抽样优选缓存机制;针对该机制存在...

大小：351KB | 2021-01-15 15:48:55
论文研究基于蚂蚁优化算法的分层强化学习.pdf

自主系统中，agent通过与环境交互来执行分配给他们的任务，采用分层强化学习技术有助于agent在大...

大小：866KB | 2020-07-17 10:05:13
连续状态自适应离散化基于K均值聚类的强化学习方法

使用聚类算法对连续状态空间进行自适应离散化,得到了基于K-均值聚类的强化学习方法.该方法的学习过程分...

大小：218KB | 2021-04-03 03:47:56
多智能体机器学习强化学习方法中文版

经典多智能体机器学习著作，懂得自然懂，将机器学习与多智能体问题结合在一起

大小：0B | 2019-04-30 05:12:58
ICML2020基于模型的强化学习方法教程279页ppt.pdf

强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,...

大小：14.64MB | 2020-10-28 04:37:53
强化学习方法及其应用研究_黄炳强.caj

强化学习方法及其应用研究_黄炳强.caj

大小：1.12MB | 2020-11-21 03:57:55
基于强化学习的路径规划

运用强化学习算法在网格环境中进行了路径规划

大小：0B | 2019-04-29 20:43:29
多智能体机器学习：强化学习方法[加拿大]霍华德

大小：0B | 2019-02-25 03:35:03
论文研究分层强化学习研究进展.pdf

首先介绍了半马尔可夫决策过程、分层与抽象等分层强化学习的理论基础；其次，较全面地比较HAM、opti...

大小：0B | 2019-07-27 07:30:00