论文研究基于CMAC的非参数化近似策略迭代增强学习.pdf

上传者：guangrongpr 2019-10-19 14:39:44上传 PDF文件 914.63KB 热度 15次

为解决在线近似策略迭代增强学习计算复杂度高、收敛速度慢的问题，引入CMAC结构作为值函数逼近器，提出一种基于CMAC的非参数化近似策略迭代增强学习（NPAPI-CMAC）算法。算法通过构建样本采集过程确定CMAC泛化参数，利用初始划分和拓展划分确定CMAC状态划分方式，利用量化编码结构构建样本数集合定义增强学习率，实现了增强学习结构和参数的完全自动构建。此外，该算法利用delta规则和最近邻思想在学习过程中自适应调整增强学习参数，利用贪心策略对动作投票器得到的结果进行选择。一级倒立摆平衡控制的仿真实验结果验证了算法的有效性、鲁棒性和快速收敛能力。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

论文研究基于CMAC的非参数化近似策略迭代增强学习.pdf

为解决在线近似策略迭代增强学习计算复杂度高、收敛速度慢的问题，引入CMAC结构作为值函数逼近器，提出...

大小：0B | 2019-10-19 14:39:44
基于状态聚类的非参数化近似广义策略迭代增强学习算法

为解决当前近似策略迭代增强学习算法普遍存在计算量大、基函数不能完全自动构建的问题,提出一种基于状态聚...

大小：682KB | 2021-01-16 18:58:04
论文研究基于增强学习协商策略的研究及优化.pdf

增强学习在电子商务中可以帮助Agent选择最优行动，并达成目标。在传统增强学习协商策略中，Agent...

大小：467KB | 2020-07-22 07:50:02
论文研究基于非参数化采样的单幅图像深度估计.pdf

针对传统单幅图像深度估计线索不足及深度估计精度不准的问题，提出一种基于非参数化采样的单幅图像深度估计...

大小：0B | 2020-04-30 01:21:32
论文研究基于参数化信道近似模型的MMSE信道估计算法的改进.pdf

基于参数化信道近似模型的MMSE信道估计算法的改进，余波，，针对正交频分复用(OFDM)系统中,由于...

大小：594KB | 2020-07-18 07:28:31
论文研究近似弧长参数化Bézier曲线的最佳逼近.pdf

考虑近似弧长参数化Bézier曲线的逼近问题。当获得Bézier曲线的一个近似弧长参数化[1]之后,...

大小：654KB | 2020-07-18 00:10:07
论文研究基于迭代学习控制的列车自动运行研究.pdf

针对列控系统难以建立精确的动力学模型问题，利用列车运行过程中包含的大量重复信息，选用迭代学习算法对列...

大小：720KB | 2020-07-16 13:43:09
论文研究基于上近似的近似推理.pdf

为使上近似蕴含的近似信息得到延伸，特将近似空间进行了扩充，从而得到树型近似空间，在其中经上近似与树的...

大小：590KB | 2020-07-23 07:27:33
非正则分布参数系统的迭代学习控制

针对一类非正则分布参数系统的迭代学习控制问题进行讨论, 该类分布参数系统由抛物型偏微分方程构成. 基...

大小：200KB | 2021-01-16 23:00:25
论文研究基于非平滑非负矩阵分解语音增强.pdf

针对非负矩阵分解稀疏性不够，通过引入平滑矩阵调节字典矩阵和系数矩阵的稀疏性，提出基于非平滑非负矩阵分...

大小：624KB | 2020-07-16 21:34:47
论文研究磁共振图像的原始对偶近似迭代重建算法.pdf

基于压缩感知（CS）的磁共振成像（MRI）是一种利用磁共振（MR）图像的稀疏性的快速成像技术，经典C...

大小：1.26MB | 2020-07-16 15:00:55
论文研究基于覆盖的粗糙近似算子.pdf

个体基于量子概率幅进行编码,并将经典遗传算法的杂交算子用于量子演化算法中演化目标的优化,提出了混合量...

大小：1.08MB | 2021-04-16 17:51:42
论文研究基于参数化流形学习的压缩传感重构方法.pdf

压缩传感是一种新的信息获取理论,它突破了传统的采样理论,将数据采集和压缩合二为一,再利用重构算法将原...

大小：0B | 2019-08-03 18:35:01
论文研究基于非合作博弈的异构融合网络非单调性选择策略研究.pdf

异构网络融合是下一代网络发展的必然趋势，网络技术接入形式的多样化使得含有多网络接入端口的用户终端可以...

大小：1.14MB | 2020-07-17 19:58:24
论文研究基于演绎长度的学习子句删除策略.pdf

学习子句删除策略是CDCL-SAT求解器中的一个重要内容，可以避免内存爆炸和加速单元传播。评估学习子...

大小：703KB | 2020-07-19 16:40:19
论文研究基于eMPlant的参数化虚拟组合设备.pdf

论文研究-基于eM-Plant的参数化虚拟组合设备.pdf, ...

大小：0B | 2020-06-01 19:24:11