基于DQN的列车节能驾驶控制方法
随着轨道交通网络规模的扩大和列车运营间隔的缩短,列车牵引能耗在快速增加。因此,通过优化列车的驾驶策略降低牵引能耗,对于轨道交通系统的节能减排具有重大意义。针对列车的驾驶策略优化问题,提出一种基于深度 Q 网络(DQN)的列车节能驾驶控制方法。首先介绍了传统的列车节能驾驶问题并构造其反问题,即通过分配最少的能耗达到规定运行时分。进一步将该问题转化为有限马尔可夫决策过程(MDP),通过设计状态动作值函数、定义动作策略选取方法等,构建基于 DQN 方法的列车节能驾驶控制方法。通过实际驾驶数据对DQN 进行训练,得到最优的状态动作值函数,并通过该值函数确定最优的能耗分配方案,从而得到最优驾驶策略。最后
用户评论