用Q-learning算法实现自动走迷宫机器人的方法示例 上传者:qqarmor37980 2022-02-14 01:56:09上传 PDF文件 530.71 KB 热度 12次 我们需要通过修改 强化学习作为机器学习算法的一种,其模式也是让智能体在“训练”中学到“经验”,以实现给定的任务。但不同于监督学习与非监督学习,在强化学习的框架中,我们更侧重通过智能体与环境的交互来学习。通常在监督学习和非监督学习任务中,智能体往往需要通过给定的训练集,辅之以既定的训练目标,通过给定的学习算法来实现这一目标。然而在强化学习中,智能体则是通过其与环境交互得到的奖励进行学习。在强化学习中有五个核心组成部分,它们分别是:环境、智能体、状态、动作和奖励。Q-Learning 是一个值迭代算法。 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论 qqarmor37980 资源:5104 粉丝:1 +关注 上传资源 免责说明 本站只是提供一个交换下载平台,下载的内容为本站的会员网络搜集上传分享交流使用,有完整的也有可能只有一分部,相关内容的使用请自行研究,主要是提供下载学习交流使用,一般不免费提供其它各种相关服务! 本站内容泄及的知识面非常广,请自行学习掌握,尽量自已动脑动手解决问题,实践是提高本领的途径,下载内容不代表本站的观点或立场!如本站不慎侵犯你的权益请联系我们,我们将马上处理撤下所有相关内容!联系邮箱:server@dude6.com