论文研究全增量式自然梯度ActorCritic学习算法 .pdf 上传者:Xieminsen 2019-09-10 08:46:18上传 PDF文件 437.01KB 热度 52次 全增量式自然梯度Actor-Critic学习算法,冯涣婷,程玉虎,尽管策略梯度强化学习算法具有较好的收敛性,但是在梯度估计过程中方差过大,影响了算法的性能。为了提高策略梯度算法的收敛速度 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论