强化学习 baseline项目源码部分解读
最近发现强化学习挺有意思,但是发现这样的博客挺少的,就随手记录下学习的过程! DeepMind团队整合了gym环境方便后人能更方便的学习,之后又把目前的强化学习算法做成了一个baseline项目,苦于现在只能mac和linux系统装,我Windows的就很尴尬了。我花了些时间来阅读它的源代码。以下分开来列出: tensorflow读取和加载训练参数的函数 2.19 对gym环境的Atari游戏重写函数源码解读 2.19 持续更新中 Google的DeepMind团队专门致力于研究人工智能,当然在强化学习领域也是世界领先水平,在2015年,DeepMind团队在nature杂志上发表了一片名为
用户评论