机器学习(MACHINE LEARNING) 【周志华版 ”西瓜书“ 笔记】 DAY16 强化学习
文章目录16.1 任务与奖赏RL与有监督学习、无监督学习的比较形象举例16.2 K-摇臂赌博机ε-贪心算法16.3 有模型学习16.4 免模型学习16.5 值函数近似16.6 模仿学习 16.1 任务与奖赏 当前的机器学习算法可以分为3种:有监督的学习(Supervised Learning)、无监督的学习(Unsupervised Learning)和强化学习(Reinforcement Learning),结构图如下所示: RL与有监督学习、无监督学习的比较 (1)有监督的学习是从一个已经标记的训练集中进行学习,训练集中每一个样本的特征可以视为是对该situation的描述,而其 lab
用户评论