infinite horizon multi robot rl:强化学习方法适用于具有连续动作空间的无限视野多机器人场景 源码
无限视野多机器人强化学习 强化学习(RL)方法适用于具有连续动作空间的无限视野多机器人场景。 这是一种基于行为准则的深度RL方法,可在连续时间和连续动作空间下提供完全异步的学习设置。 我们假设一个集中的,完全可观察的学习设置和一个分散的执行架构。 (正在建设中)
下载地址
用户评论