1. 首页
  2. 人工智能
  3. 机器学习
  4. keras实现REINFORCE算法强化学习

keras实现REINFORCE算法强化学习

上传者: 2018-12-28 23:54:09上传 文件 6.48MB 热度 82次
keras实现REINFORCE算法强化学习: # Policy Gradient Minimal implementation of Stochastic Policy Gradient Algorithm in Keras ## Pong Agent ![pg](./assets/pg.gif) This PG agent seems to get more frequent wins after about 8000 episodes. Below is the score graph.
用户评论