David Silver Reinforcement learning:David Silver的“强化学习”课程注释以及各种算法的实现 源码
David-Silver强化学习 这个软件库包含了强化学习笔记由与各种算法的讨论,无论是在Keras的实现(与TensorFlow后端),并沿的框架。 教学大纲: 第一周:强化学习简介[] [ ] 第2周:马尔可夫决策过程[] [ ] 第3周:通过动态编程进行规划[] [ ] 第4周:无模型预测[] [ ] 第5周:无模型控制[] [ ] 第6周:价值函数逼近[] [ ] 第7周:政策梯度方法[] [ ] 第8周:学习与计划整合[] [ ] 第9周:探索与开发[] [ ] 第十周:案例研究:经典游戏中的RL [] [ ] 依存关系 TensorFlow 凯拉斯 健身房
用户评论