1. 首页
  2. 数据库
  3. 其它
  4. symbolic_planning_and_rl:2021年Spring CSE 574项目 源码

symbolic_planning_and_rl:2021年Spring CSE 574项目 源码

上传者: 2021-04-27 09:25:14上传 ZIP文件 42.07MB 热度 8次
结合计划和深度强化学习来解决长期多步骤任务 抽象的: 尽管规划方法对于可以轻松且有效地以符号表示形式表示的领域中的长远问题是可靠的,但这些方法无法很好地适应动态环境中的不确定性。 同样,对于传统的深度强化学习(DRL)问题,数据可用性成为解决复杂问题的关键瓶颈。 此外,DRL解决方案的黑盒性质会影响该方法的可解释性。 将计划学习和强化学习相结合的混合方法背后的想法是,利用这两种方法的优势,在复杂且经常变化的环境中进行有效而稳健的决策。 在这个项目中,我们探索了这个概念,为两个广泛使用的领域(出租车和Atari游戏:蒙特祖玛的复仇)制定了规划+ RL框架,并报告了我们的实验见解。 注意:实验结果将很快添加。 参考: [Lyu等。 2019]柳(D.); 杨峰; 刘宝和古斯塔夫森2019年。Sdrl:利用符号计划进行可解释且数据有效的深度强化学习。 AAAI人工智能会议论文集,第33卷,2
用户评论