convolutional_dqn_pacman:用于OpenAI Pacman域的具有双深度Q学习(DQN)代理的集成卷积神经网络(CNN) 源码
convolutional_dqn_pacman 用于OpenAI Pacman域的具有双深度Q学习(DQN)代理的卷积神经网络(CNN)。 实施利用“双重”目标网络在正确的方向上指导学习,并利用随机采样的经验重放来防止状态转换依赖性干扰学习。 状态由三维红绿蓝(RGB)阵列表示,这使卷积神经网络(CNN)非常适合于训练代理的任务。 马尔可夫决策过程(MDP)和整体环境由OpenAI定义/提供。 Tensorboard已集成到该项目中,以进行培训/进度可视化。 笔记: 根据经验,通过多次遍历运行DQN模型(从以前的遍历保存权重,并使用这些权重再次初始化运行模型)可以带来更好的性能,因为
用户评论