udacity_deep_reinforcement_learning_project2 源码
总览 该存储库包含我为Udacity的纳米计划“深度强化学习”于2020年末开始的“ Project 2”提交内容。 它提供了解决“ Reacher”环境的学习代理的实现: 项目详情 在“ Reacher”环境中,代理是一个双臂,试图将目标尽可能长时间地定位在目标位置。 状态空间有33个维度,其中包含手臂的位置,旋转,速度和角速度。 利用此状态信息,代理必须通过选择手臂关节的动作来最大化总回报。 在每个时间步长,这四个可用动作对应于与代理手臂的两个关节相关的扭矩。 每个转矩作用与[-1,1]范围内的值相关。 该任务是情节性的,这意味着它具有清晰的开始和结束,并且在每个情节开始时都会重置所有
用户评论
下载好久了,现在都荒废了
刚好用的,不错
很不错,帮助很大
感觉可以的,点个赞
非常不错,值得学习参考
很不错,点个赞
这个Demo很棒
真的还可以
不错,感觉可以用