一种基于信念状态压缩的实时POMDP算法
针对求解部分可观察马尔可夫决策过程(POMDP)信念状态空间是NP难问题,提出一种信念状态空间压缩(BSSC)算法.将信念状态空间的高维压缩到低维,利用动态贝叶斯网络对状态转移函数,观察函数和报酬函数进行压缩,降低求解规模,达到实时决策的目的.对比实验表明,所提出的算法可以快速求解最优策略和最优值函数.
下载地址
用户评论