1. 首页
  2. 移动开发
  3. 其他
  4. 论文研究 基于RPkNN Sarsa(.pdf

论文研究 基于RPkNN Sarsa(.pdf

上传者: 2020-07-20 00:25:03上传 PDF文件 1.06MB 热度 15次
基于kNN-Sarsaλ强化学习的机器人路径规划方法虽然收敛速度快, 但该算法容易陷入局部最优值, 且未考虑环境信息的不完全可观测性。为此, 设计了一种随机扰动random perturbationkNN-Sarsaλ强化学习算法, 利用Bayesian规则对传感器探测信息的不确定性进行了处理, 建立了基于栅格地图的仿真环境模型。仿真实验结果表明, 该方法不仅收敛性好, 能有效缓解kNN-Sarsaλ算法易陷入局部最优的现象, 且在传感器探测信息不确定的情况下仍能搜索到最优路径。
下载地址
用户评论