虚幻:使用无人监督的辅助任务进行强化学习 源码
虚幻 关于 复制Google Deep Mind的论文“使用无人监督的辅助任务进行强化学习”中描述的UNREAL算法。 在TensorFlow和DeepMind Lab环境中实施。 预习 seekavoid_arena_01 楼梯到瓜 nav_maze_static_01 网络 卷积层和LSTM层的所有权重都是共享的。 要求 TensorFlow(经过r1.0测试) 深度实验室 麻木 cv2 pygame matplotlib 结果 “ seekavoid_arena_01”级别 “ nav_maze_static_01”级别 如何训练 首先,下载并安装DeepMind Lab
下载地址
用户评论