1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究基于深度强化学习的移动机器人路径规划.pdf

论文研究基于深度强化学习的移动机器人路径规划.pdf

上传者: 2019-09-27 19:01:40上传 其他文档文件 500kb 热度 38次
为解决传统的深度[Q]网络模型下机器人探索复杂未知环境时收敛速度慢的问题,提出了基于竞争网络结构的改进深度双[Q]网络方法(ImprovedDuelingDeepDouble[Q]-Network,IDDDQN)。移动机器人通过改进的DDQN网络结构对其三个动作的值函数进行估计,并更新网络参数,通过训练网络得到相应的[Q]值。移动机器人采用玻尔兹曼分布与[ε]-greedy相结合的探索策略,选择一个最优动作,到达下一个观察。机器人将通过学习收集到的数据采用改进的重采样优选机制存储到缓存记忆单元中,并利用小批量数据训练网络。实验结果显示,与基本DDQN算法比,IDDDQN训练的机器人能够更快地适应未知环境,网络的收敛速度也得到提高,到达目标点的成功率增加
用户评论