论文研究一种基于动态参数调整的强化学习动作选择机制.pdf

Name: 论文研究一种基于动态参数调整的强化学习动作选择机制.pdf
Rating: 4.5 (139 reviews)
Author: qq_32494336

上传者：qq_32494336 2020-03-10 10:33:39上传 PDF文件 685.02KB 热度 139次

强化学习是一种重要的无监督机器学习技术，它能够利用不确定的环境下的奖赏发现最优的行为序列，实现动态环境下的在线学习，被广泛地应用到Agent系统当中。应用强化学习算法的难点之一就是如何平衡强化学习当中探索和利用之间的关系，即如何进行动作选择。结合Q学习在ε-greedy策略基础上引入计数器，从而使动作选择时的参数ε能够分阶段进行调整，从而更好地平衡探索和利用间的关系。通过对方格世界的实验仿真，证明了方法的有效性。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

论文研究一种基于动态参数调整的强化学习动作选择机制.pdf

强化学习是一种重要的无监督机器学习技术，它能够利用不确定的环境下的奖赏发现最优的行为序列，实现动态环...

大小：0B | 2020-03-10 10:33:39
论文研究一种基于蚁群算法的云存储副本动态选择机制研究.pdf

针对云存储技术中副本选择优化问题，提出一种基于蚁群原理的云存储副本动态选择算法。构建基于蚁群的副本动...

大小：1.04MB | 2020-07-24 22:15:33
论文研究一种基于效用理论的异构接入网选择机制.pdf

一种基于效用理论的异构接入网选择机制，吴青潇，李文璟，多种无线接入技术的飞速发展为用户提供了更丰富的...

大小：359KB | 2020-07-20 00:30:58
论文研究基于一种自适应选择机制的混合优化算法.pdf

针对于微分进化（DE）和粒子群优化（PSO）算法收敛精度较低和收敛速度慢的缺点，提出了基于这两种算法...

大小：0B | 2019-09-22 01:44:51
论文研究一种ABC支持型接入网络选择机制.pdf

一种ABC支持型接入网络选择机制，王兴伟，郭磊，本文提出了一种总最佳连接ABC（alwaysbest...

大小：0B | 2020-05-31 18:37:42
论文研究一种基于强化学习的UAV目标搜索算法.pdf

针对未知环境中无人机（unmannedaerialvehicles,UAV）目标搜索问题进行研究。建...

大小：0B | 2020-05-02 11:41:41
论文研究基于接口匹配和选择机制的Web服务动态组合.pdf

基于接口匹配和选择机制的Web服务动态组合，倪月芳，，通过把服务抽象为具有输入输出接口的实体，本文提...

大小：0B | 2019-09-19 07:48:13
论文研究基于深度强化学习的动态计算卸载.pdf

基于深度强化学习的动态计算卸载，程百川，刘丹谱，移动边缘计算在移动网络边缘提供计算资源。为了减少执行...

大小：0B | 2020-04-26 07:19:57
论文研究一种新的基于蚁群优化的模糊强化学习算法.pdf

模糊Sarsa学习(FSL)是基于Sarsa学习而提出的一种模糊强化学习算法，它是一种通过在线策略来...

大小：0B | 2019-09-09 06:03:06
一种基于强化学习的全局最优方法

提出了一种优化任何给定数学函数的新颖方法，称为“强化学习算法”（MORELA）。尽管强化学习（RL...

大小：1.63MB | 2020-07-23 11:07:09
论文研究一种基于k均值的DBSCAN算法参数动态选择方法.pdf

为解决DBSCAN聚类算法的Eps及MinPts参数选择问题，提出一种领域无关的参数动态选择方法。首...

大小：0B | 2020-05-04 11:31:19
论文研究传感器网络中一种能量有效的簇头选择机制.pdf

针对LEACH算法存在簇头节点个数和位置分布不稳定的现象，在簇头节点的选择过程中，充分考虑簇头节点的...

大小：533KB | 2020-07-24 08:00:19
基于强化学习的动态单机调度研究.pdf

生产调度位于计算机集成制造系统体系结构中的中间层，是控制与管理一体化的接合部。向上要给企业经营战略决...

大小：0B | 2019-05-13 07:28:49
论文研究基于利润场的云联盟合作伙伴动态选择机制研究.pdf

云联盟是云计算发展过程中的一种能优化资源配置的组织形式,在云联盟的发展过程中,选择合适的合作伙伴是保...

大小：939KB | 2020-08-08 21:19:47
论文研究基于流的异构网络接入选择机制.pdf

基于流的异构网络接入选择机制，冯英萍，王晓湘，随着无线通信技术的进步和异构网络的发展，多模终端变得越...

大小：0B | 2019-09-15 11:26:01
论文研究同顺序Flow shop问题的一种遗传强化学习算法.pdf

论文研究-同顺序Flow shop问题的一种遗传强化学习算法 .pdf,

大小：467KB | 2020-07-18 12:26:54