1. 首页
  2. 人工智能
  3. 机器学习
  4. 中国科学院大学高级人工智能复习总结

中国科学院大学高级人工智能复习总结

上传者: 2025-05-26 09:04:24上传 PDF文件 1.5MB 热度 4次
策略估值的目标是为了寻找更优的策略(策略提升)  策略估值根据策略,计算其估值函数  策略提升  根据当前策略的估值函数,寻找更优的策略(如果存在),逐步寻 找到最优策略  根据策略,的估值函数,寻找更优策略  提升方法
下载地址
用户评论