1. 首页
  2. 数据库
  3. 其它
  4. 《强化学习在阿里的技术演进与业务创新》读书笔记_00建模

《强化学习在阿里的技术演进与业务创新》读书笔记_00建模

上传者: 2021-02-01 02:11:22上传 PDF文件 83.69KB 热度 11次
1 背景知识介绍 机器学习算法大致可分为3种:监督学习、非监督学习、强化学习。 在阿里移动电商平台中,人机交互的便捷,碎片化使用的普遍性,页面切换的串行化,用户轨迹的可跟踪性等都要求系统能够对变幻莫测的用户行为以及瞬息万变的外部环境进行完整地建模。基于监督学习的方式缺少有效的探索能力,系统倾向于给消费者推送曾经发生过行为的信息单元(商品、店铺或问题答案)。而强化学习作为一种有效的基于用户与系统交互过程建模和最大化过程累积收益的学习方法,是最接近自然界动物学习、决策本质的一种学习范式,具有优良的自学习、探索能力,在一些阿里具体的业务场景中进行了很好的实践并得到大规模应用。 相对于DeepMind
下载地址
用户评论