1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究一种新的基于蚁群优化的模糊强化学习算法.pdf

论文研究一种新的基于蚁群优化的模糊强化学习算法.pdf

上传者: 2019-09-09 06:03:06上传 PDF文件 528.97KB 热度 38次
模糊Sarsa学习(FSL)是基于Sarsa学习而提出的一种模糊强化学习算法,它是一种通过在线策略来逼近动作值函数的算法,其每条模糊规则中,动作的选择是按照Softmax公式选择下一个动作。对于连续空间的复杂学习任务,FSL不能较好平衡探索和利用之间的关系,为此提出了一种新的基于蚁群优化的模糊强化学习算法(ACO-FSL),主要工作是把蚁群优化思想与传统的模糊强化学习算法结合起来形成一种新的算法。给出了算法的设计原理、方法和具体步骤,小车爬山问题的仿真实验表明,提出的ACO-FSL算法在学习速度和稳定性上优于FSL算法。
下载地址
用户评论