1. 首页
  2. 数据库
  3. 其它
  4. 如何在MLlib中实现随机森林和梯度提升树(GBTs)?

如何在MLlib中实现随机森林和梯度提升树(GBTs)?

上传者: 2021-02-01 09:02:06上传 PDF文件 427.1KB 热度 20次
Spark1.2在MLlib中引入了随机森林和梯度提升树(GBTs).这两种机器学习方法适用于分类和回归,且是在机器学习算法中应用得最多和最成功的算法。随机森林和GBTs都是集成学习算法,它们通过集成多棵决策树来实现强分类器。这篇博文中,我们会阐述这些模型及其他们在MLlib中的分布式实现。我们也给出一些简单例子和要点以便你知道如何上手。简单来说,集成学习方法就是基于其他的机器学习算法,并把它们有效的组合起来的一种机器学习算法。组合产生的算法相比其中任何一种算法模型更强大、准确。在MLlib1.2中,我们使用决策树作为基础模型。我们提供两种集成算法:随机森林和梯度提升树(GBTs)。两者之
用户评论