1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究基于粒子滤波的移动机器人SLAM改进算法.pdf

论文研究基于粒子滤波的移动机器人SLAM改进算法.pdf

上传者: 2020-01-02 18:01:33上传 PDF文件 1.2MB 热度 38次
强化学习是提高机器人完成任务效率的有效方法,目前比较流行的学习方法一般采用累积折扣回报方法,但平均值回报在某些方面更适于多机器人协作。累积折扣回报方法在机器人动作层次上可以提高性能,但在多机器人任务层次上却不会得到很好的协作效果,而采用平均回报值的方法,就可以改变这种状态。本文把基于平均值回报的蒙特卡罗学习应用于多机器人合作中,得到很好的学习效果,实际机器人实验结果表明,采用平均值回报的方法优于累积折扣回报方法。
用户评论