1. 首页
  2. 课程学习
  3. 专业指导
  4. 强化学习(TD算法)

强化学习(TD算法)

上传者: 2019-09-14 19:17:45上传 PPT文件 456KB 热度 26次
强化学习的任务就是利用观察到的回报来学习针对某个环境的最优或接近最优策略。它作为一种无导师机器学习方法,把环境的反馈作为输入、通过学习选择能达到其目标的最优动作
用户评论
码姐姐匿名网友 2019-09-14 19:17:46

TD算法讲的太少 不详细

码姐姐匿名网友 2019-09-14 19:17:46

不错,大体了解了强化学习。

码姐姐匿名网友 2019-09-14 19:17:46

挺好的...不过依然没弄懂...

码姐姐匿名网友 2019-09-14 19:17:46

挺好的,有点帮助

码姐姐匿名网友 2019-09-14 19:17:46

还不错呢 虽然不是很懂。没有代码 ,只有介绍

码姐姐匿名网友 2019-09-14 19:17:46

对算法的描述不错,但是很有帮助

码姐姐匿名网友 2019-09-14 19:17:46

介绍的很清楚,学习中

码姐姐匿名网友 2019-09-14 19:17:46

对算法的描述不错,如果能够增加一些实现细节就更好了

码姐姐匿名网友 2019-09-14 19:17:46

还不错吧,就是将的比较泛

码姐姐匿名网友 2019-09-14 19:17:46

对算法的描述很详细。