1. 首页
  2. 人工智能
  3. 深度学习
  4. 通过深度强化学习的交通信号时间

通过深度强化学习的交通信号时间

上传者: 2019-05-20 01:02:13上传 PDF文件 909KB 热度 30次
通过深度强化学习的交通信号时间,IEEE最新文章.打造交通信号控制的强化学习系统如果把由信号机、检测器等组成的交通信号控制系统当成一个“智能体”,将我们目睹的人车路当成“环境”,通过如下方式就可以构造强化学习系统:传感器从环境里获取观测状态(例如:流量、速度、排队长度等),传递给信号机,信号控制系统根据这些状态来选择一个得分最高状态的动作来执行(例如:当前相位保持绿灯或者切换成红灯),并对执行效果进行回馈(例如:采用排队长度作为回报函数),系统根据回报结果,调整打分系统的参数。这样就形成一个循环的过程,就能达到不断学习改进。
用户评论