1. 首页
  2. 数据库
  3. 其它
  4. udacity_deep_reinforcement_learning_project2 源码

udacity_deep_reinforcement_learning_project2 源码

上传者: 2021-02-09 19:45:46上传 ZIP文件 1.22MB 热度 10次
总览 该存储库包含我为Udacity的纳米计划“深度强化学习”于2020年末开始的“ Project 2”提交内容。 它提供了解决“ Reacher”环境的学习代理的实现: 项目详情 在“ Reacher”环境中,代理是一个双臂,试图将目标尽可能长时间地定位在目标位置。 状态空间有33个维度,其中包含手臂的位置,旋转,速度和角速度。 利用此状态信息,代理必须通过选择手臂关节的动作来最大化总回报。 在每个时间步长,这四个可用动作对应于与代理手臂的两个关节相关的扭矩。 每个转矩作用与[-1,1]范围内的值相关。 该任务是情节性的,这意味着它具有清晰的开始和结束,并且在每个情节开始时都会重置所有
用户评论
码姐姐匿名网友 2019-05-31 22:25:06

下载好久了,现在都荒废了

码姐姐匿名网友 2019-05-31 22:25:06

刚好用的,不错

码姐姐匿名网友 2019-05-31 22:25:06

很不错,帮助很大

码姐姐匿名网友 2019-05-31 22:25:06

感觉可以的,点个赞

码姐姐匿名网友 2019-05-31 22:25:06

非常不错,值得学习参考

码姐姐匿名网友 2019-05-31 22:25:06

很不错,点个赞

码姐姐匿名网友 2019-05-31 22:25:06

这个Demo很棒

码姐姐匿名网友 2019-05-31 22:25:06

真的还可以

码姐姐匿名网友 2019-05-31 22:25:06

不错,感觉可以用