基于状态聚类的非参数化近似广义策略迭代增强学习算法

Name: 基于状态聚类的非参数化近似广义策略迭代增强学习算法
Rating: 4.5 (25 reviews)
Author: zcjzy

上传者：zcjzy 2021-01-16 18:58:04上传 PDF文件 682.31KB 热度 25次

为解决当前近似策略迭代增强学习算法普遍存在计算量大、基函数不能完全自动构建的问题,提出一种基于状态聚类的非参数化近似广义策略迭代增强学习算法(NPAGPI-SC).该算法利用二级随机采样过程采集样本,利用trial-and-error过程和以样本完全覆盖为目标的估计方法计算逼近器初始参数,利用delta规则和最近邻思想在学习过程中自适应地调整逼近器,利用贪心策略选择应执行的动作.一级倒立摆平衡控制的仿真实验结果验证了所提出算法的有效性和鲁棒性.

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

基于状态聚类的非参数化近似广义策略迭代增强学习算法

为解决当前近似策略迭代增强学习算法普遍存在计算量大、基函数不能完全自动构建的问题,提出一种基于状态聚...

大小：682KB | 2021-01-16 18:58:04
论文研究基于CMAC的非参数化近似策略迭代增强学习.pdf

为解决在线近似策略迭代增强学习计算复杂度高、收敛速度慢的问题，引入CMAC结构作为值函数逼近器，提出...

大小：0B | 2019-10-19 14:39:44
非正则分布参数系统的迭代学习控制

针对一类非正则分布参数系统的迭代学习控制问题进行讨论, 该类分布参数系统由抛物型偏微分方程构成. 基...

大小：200KB | 2021-01-16 23:00:25
非迭代聚类_Rodriguez.SM

对非迭代算法进行聚类进行了很好的辅助性说明

大小：1.53MB | 2020-09-11 15:42:49
迭代求近似根牛顿算法

牛顿算法求方程的近似值 c++ (builder 6。0)

大小：55KB | 2020-10-28 02:36:06
基于广义神经网络的网络入侵聚类算法-聚类结果分享

本资料介绍了基于广义神经网络的网络入侵聚类算法，通过对网络入侵数据进行聚类分析，可以有效地识别网络中...

大小：25.41KB | 2023-09-17 14:32:10
非扩张映射和广义变分不等式迭代算法

针对非扩张映射的不动点问题和Hilbert空间中广义变分不等式的问题,利用粘滞逼近算法,建立更一般的...

大小：171KB | 2020-07-24 21:29:35
基于泰勒级数的迭代学习算法

针对存在不确定扰动的线性时变系统的轨迹跟踪控制问题, 提出了基于泰勒级数的迭代学习算法. 该算法利...

大小：279KB | 2021-02-19 11:06:55
广义神经网络的聚类算法_网络入侵聚类

本代码主要利用MATLAB工具进行广义神经网络的聚类算法的仿真，实现网络入侵聚类的模拟

大小：0B | 2019-05-04 07:07:07
广义神经网络的聚类算法-网络入侵聚类

大小：0B | 2019-02-17 07:52:49
基于迭代加权虚拟力算法的DSNs覆盖增强

针对现有有向传感器网络(DSNs)覆盖增强算法复杂且收敛速度较慢的问题,在方向可调的有向感知模型基础...

大小：444KB | 2020-08-20 03:48:43
非稳腔迭代算法

Unsteady cavity iterative algorithm

大小：0B | 2019-06-25 18:08:29
基于局部信息的快速近似谱聚类

光谱聚类已成为近年来最流行的聚类方法之一。但是,其高计算复杂性使其无法应用于大规模数据集。为了解...

大小：921KB | 2021-04-06 18:56:03
非参数不确定系统的有限时间迭代学习控制

针对任意初态情形,引入初始修正作用,研究一类非参数不确定时变系统能够达到实际完全跟踪性能的迭代学习控...

大小：3.37MB | 2021-04-07 00:07:11
论文研究基于混沌策略状态转移算法的混沌系统参数辨识.pdf

针对混沌系统的参数辨识是一个多维参数的优化问题，提出了基于混沌策略状态转移算法的混沌系统参数辨识方法...

大小：0B | 2019-09-26 09:25:35
基于灰度聚类算法的红外图像增强研究

大小：0B | 2019-01-11 17:27:28