1. 首页
  2. 移动开发
  3. 其他
  4. 论文研究 增强学习算法的性能测试与对比分析.pdf

论文研究 增强学习算法的性能测试与对比分析.pdf

上传者: 2020-07-16 14:14:45上传 PDF文件 502.92KB 热度 12次
研究了几类典型增强学习算法的性能评估问题,包括Q-学习算法、最小二乘策略迭代(LSPI)和基于核的最小二乘策略迭代 (KLSPI)算法等,重点针对Markov决策问题(MDP)的值函数平滑特性对算法性能的影响进行了研究。分别利用值函数非平滑的组合优化问题——旅行商问题(TSP)和值函数平滑的Mountain-Car运动控制问题,对不同增强学习算法的性能进行了测试和比较分析。分析了三种算法针对不同类型问题的各自特点,通过实验对比,验证了近似策略迭代算法,特别是KLSPI算法在解决值函数平滑的序贯决策问题时性
下载地址
用户评论