MineRL 源码
抽象的 我们将使用流行的沙盒视频游戏Minecraft及其相关的Malmo平台来训练代理,以成功打击被称为“暴民”的游戏内实体。 我们希望,像我们在模拟环境中用于训练代理的方法那样,可以外推到现实世界中的应用程序,例如机器人技术。 我们将使用一种流行的强化学习技术,称为Deep Q Learning,它使用了几种不同的特征表示,并比较了性能差异。 简介与背景 Minecraft是一款流行的沙盒视频游戏,其中包含许多被称为“暴民”的敌对非玩家实体; 这些实体旨在攻击和杀死玩家角色。 我们的特工将必须学习对付每种类型的敌对生物的策略,以打败尽可能多的生物并生存尽可能长的时间为目标。 此外,Minecraft“世界”中的环境可以使用算法随机生成或由玩家构建。 为了为我们的代理商创造一个封闭的环境来学习和对抗这些暴民,我们将使用Microsoft的Project Malmo。 在Minecraft
下载地址
用户评论