1. 首页
  2. 人工智能
  3. 机器学习
  4. Trust Region Policy Optimization PDF论文下载

Trust Region Policy Optimization PDF论文下载

上传者: 2019-09-25 15:32:34上传 PDF文件 952.29KB 热度 33次
TRPO算法的论文,是强化学习算法PPO、DPPO的基础,论文中对算法优化原理进行了比较详细的推导
用户评论