论文研究一种基于高斯过程的行动者评论家算法.pdf

Name: 论文研究 一种基于高斯过程的行动者评论家算法.pdf
Rating: 4.5 (40 reviews)
Author: CSDN阿坤

上传者：CSDN阿坤 2020-07-20 01:46:36上传 PDF文件 1.48MB 热度 40次

强化学习领域的一个研究难点是在大规模或连续空间中平衡探索和利用的问题。针对该问题，应用函数近似与高斯过程方法，提出新的行动者评论家（actor-critic，AC）算法。该算法在actor中使用时间差分误差构造关于策略参数的更新公式；在critic中利用高斯过程对线性带参值函数建模，结合生成模型，根据贝叶斯推理求解值函数的后验分布。将该算法应用于平衡杆实验中，实验结果表明，算法收敛速度较快，可以有效解决在大规模或连续空间中探索和利用的平衡问题，具有较好的性能。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

论文研究一种基于高斯过程的行动者评论家算法.pdf

强化学习领域的一个研究难点是在大规模或连续空间中平衡探索和利用的问题。针对该问题，应用函数近似与高斯...

大小：1.48MB | 2020-07-20 01:46:36
论文研究连续空间的递归最小二乘行动者评论家算法.pdf

传统的行动者—评论家（actor-critic，AC）算法用在连续空间时，数据利用率低、收敛慢，而现...

大小：1.2MB | 2020-07-21 04:34:12
增量式双自然策略梯度的行动者评论家算法

针对强化学习中已有连续动作空间算法未能充分考虑最优动作的选取方法和利用动作空间的知识,提出一种对自然...

大小：1.23MB | 2021-01-17 02:08:56
一种用于连续动作空间的最小二乘行动者评论家方法

解决具有连续动作空间的问题是当前强化学习领域的一个研究热点和难点.在处理这类问题时,传统的强化学习算...

大小：2.12MB | 2021-03-25 03:32:50
论文研究一种基于高斯过程回归的图像插值算法.pdf

一种基于高斯过程回归的图像插值算法，汪谦，杜军平，图像插值是图像处理中的经典问题。本文提出一种新颖的...

大小：0B | 2020-06-01 22:51:17
论文研究一种基于聚类的高斯混合模型算法.pdf

一种基于聚类的高斯混合模型算法，马瑞云，，本文介绍了一种高斯混合模型算法的改进方法---将聚类算法与...

大小：0B | 2019-09-08 20:30:34
论文研究一种滤除高斯噪声新算法.pdf

一种滤除高斯噪声新算法，王小兵，孙久运，为了更有效滤除数字图像中的高斯噪声，提出了一种新型滤波算法。...

大小：0B | 2020-04-18 17:15:03
一种新高斯过程分类算法

由于需要利用高斯函数逼近潜变量函数的后验概率, 传统高斯过程分类算法通常都存在计算复杂度高的问题. ...

大小：183KB | 2021-01-31 14:24:51
论文研究一种基于过程改进的度量模型.pdf

如何提高软件质量始终是软件工程领域研究的重要方向，基于度量的量化管理是目前最有效的质量保证手段之一，...

大小：0B | 2019-07-30 02:39:37
论文研究一种基于密度的Kmeans算法研究.pdf

针对传统K-means算法必须事先确定聚类数目以及对初始聚类中心的选取比较敏感的缺陷，采用基于密度的...

大小：0B | 2019-09-04 10:58:40
论文研究一种基于.pdf

将发布的数据用于微观数据表包含的敏感属性分析，同时保持个人隐私，是一个越来越重要的问题。当前，k-匿...

大小：0B | 2019-08-17 15:31:48
论文研究一种基于过程挖掘的业务过程决策规则发现算法.pdf

针对现有的决策点规则挖掘研究在挖掘时都只考虑了业务对象等过程外部对象的属性, 而忽视了业务过程的内部...

大小：769KB | 2020-07-27 01:20:34
论文研究一种基于SRUKF的FastSLAM算法.pdf

标准FastSLAM算法存在着粒子集退化和线性化误差累积的缺陷。针对上述问题,提出了基于平方根无迹卡...

大小：0B | 2020-03-18 15:05:46
论文研究基于Dijkstra的一种优化算法.pdf

基于Dijkstra的一种优化算法，张凯，白雪，现如今最短路径问题在运输等其他路径选择中有着广泛的应...

大小：0B | 2019-09-10 01:17:29
SAC软演员评论家的实施源码

软演员评论家(SAC) Descllione dell'algoritmo 软演员评论家深度强化学习...

大小：1.10MB | 2021-04-08 19:20:34
论文研究基于一种新型核函数高斯过程的双频微带天线设计.pdf

针对采用高斯过程进行建模时，不同核函数形式有着不同学习效果的问题，提出了一种自定义的平方指数形式的核...

大小：944KB | 2020-07-17 20:04:31

论文研究 一种基于高斯过程的行动者评论家算法.pdf

论文研究一种基于高斯过程的行动者评论家算法.pdf