1. 首页
  2. 移动开发
  3. 其他
  4. 论文研究 一种基于转向限制的城市交通网最短路径算法.pdf

论文研究 一种基于转向限制的城市交通网最短路径算法.pdf

上传者: 2020-07-19 20:18:05上传 PDF文件 923.21KB 热度 19次
倒立摆系统是强化学习的一种重要的应用领域。首先分析指出在倒立摆系统中,常用的强化学习算法存在着极限环问题,算法无法正确收敛、控制策略不稳定。但是由于在简单的一级倒立摆系统中算法的控制策略不稳定的现象还不明显,因此极限环问题常常被忽视。针对强化学习算法中极限环问题,提出基于动作连续性准则的强化学习算法。算法采用修正强化信号和改进探索策略的方法克服极限环对倒立摆系统的影响。将提出的算法用于二级倒立摆的实际系统控制中,实验结果证明算法不仅能成功控制倒立摆,而且可以保持控制策略的稳定。
下载地址
用户评论