深度学习 蒙特卡罗方法
蒙特卡罗方法(Monte Carlo Methods)是强化学习中基于无模型的训练方法 蒙特卡罗预测的目的是来预测状态值(state value)。
下载地址
用户评论