1. 首页
  2. 数据库
  3. 其它
  4. mabalgs:多武装强盗算法库(MAB) 源码

mabalgs:多武装强盗算法库(MAB) 源码

上传者: 2021-02-05 18:28:23上传 ZIP文件 1.34MB 热度 16次
多武装强盗算法(MAB) 多武装强盗(MAB)是一个问题,当在分配时仅部分了解每个选择的属性时,必须在竞争性(替代)选择之间分配固定的有限资源集,以最大化其预期收益,随着时间的流逝或通过分配资源来更好地理解。 在问题中,每台机器从特定于该机器的概率分布中提供随机奖励。 赌徒的目标是通过一系列的拉动获得最大的奖励总和。 赌徒在每次审判中面临的至关重要的折衷是在具有最高预期收益的机器的“开发”和“探索”之间获得有关其他机器的预期收益的更多信息。 机器学习中也面临着探索与开发之间的权衡。 MAB帮助解决的主要问题是在线实验中的人口分裂。 正在安装 pip install mabalgs 算法(
用户评论