阿里 强化学习在阿里的技术演进与业务创新 上传者:ytaxm 2018-12-17 10:00:36上传 RAR文件 17.55MB 热度 31次 当前的机器学习算法⼤致可以分为有监督的学习、⽆监督的学习和强化学 习(Reinforcement Learning)等。强化学习和其他学习⽅法不同之处在于强化学 习是智能系统从环境到⾏为映射的学习,以使奖励信号函数值最⼤。如果智能 体的某个⾏为策略导致环境正的奖赏,那么智能体以后产⽣这个⾏为策略的趋 势便会加强。强化学习是最接近于⾃然界动物学习的本质的⼀种学习范式。然 ⽽强化学习从提出到现在,也差不多有半个世纪左右,它的应⽤场景仍很有限, 规模⼤⼀点的问题就会出现维数爆炸,难于计算,所以往往看到的例⼦都是相 对简化的场景 下载地址 用户评论 更多下载 下载地址 立即下载 收藏 腾讯 微博 用户评论 发表评论 ytaxm 资源:12 粉丝:0 +关注 上传资源 免责说明 本站只是提供一个交换下载平台,下载的内容为本站的会员网络搜集上传分享交流使用,有完整的也有可能只有一分部,相关内容的使用请自行研究,主要是提供下载学习交流使用,一般不免费提供其它各种相关服务! 本站内容泄及的知识面非常广,请自行学习掌握,尽量自已动脑动手解决问题,实践是提高本领的途径,下载内容不代表本站的观点或立场!如本站不慎侵犯你的权益请联系我们,我们将马上处理撤下所有相关内容!联系邮箱:server@dude6.com