1. 首页
  2. 人工智能
  3. 机器学习
  4. QLearning更新公式

QLearning更新公式

上传者: 2019-07-23 12:16:50上传 DOC文件 9KB 热度 21次
强化学习的参数更新公式。Q-Learning更新公式:Qnew(st-1,at-1)=(1-α)‧Q(st-1,at-1)+α(rt+γ‧maxQ(st,a))其中maxQ(st,a)用于查找st下期望回报最好的行为。α∈(0,1],γ∈[0,1],rt是t时刻的奖赏。
下载地址
用户评论