1. 首页
  2. 数据库
  3. 其它
  4. DRLND Project Navigation:Udacity深度强化学习专家纳米学位的第一个项目 收集黄色香蕉 源码

DRLND Project Navigation:Udacity深度强化学习专家纳米学位的第一个项目 收集黄色香蕉 源码

上传者: 2021-03-24 01:36:34上传 ZIP文件 123.57KB 热度 8次
原始存储库可在此处找到 项目1:导航 介绍 对于此项目,您将训练一个代理商在一个大型的方形世界中导航(并收集香蕉!)。 提供+1的奖励以收集黄色香蕉,提供-1的奖励以收集蓝色香蕉。 因此,代理商的目标是尽可能多地收集黄色香蕉,同时避免使用蓝色香蕉。 状态空间具有37个维度,并包含主体的速度以及围绕主体向前方向的物体的基于光线的感知。 有了这些信息,代理就必须学习如何最好地选择动作。 提供了四个离散操作,分别对应于: 0向前移动。 1向后移动。 2向左转。 3向右转。 该任务是情节性的,并且为了解决环境,您的特工必须在100个连续情节中获得+13的平均得分。 入门 从下面的链接之一下载环境。 您只需要选择与您的操作系统匹配的环境即可: Linux: Mac OSX: Windows(32位): Windows(64位): (对于Windows用户)如果需要帮助来确定您的计
用户评论
码姐姐匿名网友 2020-07-25 07:17:17

实用。简单的例子,把每一个操作都写清楚了

码姐姐匿名网友 2020-07-25 07:17:17

已经应用于项目

码姐姐匿名网友 2020-07-25 07:17:17

不错,有帮助的。

码姐姐匿名网友 2020-07-25 07:17:17

感觉有点不好用,不过还算用心了。

码姐姐匿名网友 2020-07-25 07:17:17

不错,不过没有封装。

码姐姐匿名网友 2020-07-25 07:17:17

感觉不是很好用,太简单。

码姐姐匿名网友 2020-07-25 07:17:17

为嘛运行了没反应………………

码姐姐匿名网友 2020-07-25 07:17:18

不错,挺实用的

码姐姐匿名网友 2020-07-25 07:17:18

拿来用用很好很强大