dqn pong master:深度学习课程最终项目 源码
以下存储库详细介绍了使用强化学习的深度学习代理的实现,特别是详细介绍了深度Q网络的使用,以在经典Atari 2600主机游戏Pong的上下文中实现最新的结果。 给定的解决方案包括高级优化工具,例如epsilon-greedy算法,重播缓冲区和目标网络,以进一步提高代理的准确性。 结果表明,我们的模型设法胜过硬编码的Pong代理,并以21-0(最高分)获胜。
下载地址
用户评论