1. 首页
  2. 人工智能
  3. 机器学习
  4. 强化学习读书笔记:第六章

强化学习读书笔记:第六章

上传者: 2024-04-27 00:15:03上传 PDF文件 123.31KB 热度 5次

理解马尔科夫决策过程(MDP)

贝尔曼方程和价值迭代

策略迭代与 Q 学习

MDP 的扩展:部分可观测 MDP 和连续状态 MDP

下载地址
用户评论