1. 首页
  2. 数据库
  3. 其它
  4. Spark随机森林算法原理、源码分析及案例实战

Spark随机森林算法原理、源码分析及案例实战

上传者: 2021-02-01 08:03:06上传 PDF文件 908.19KB 热度 13次
本文首先对决策树算法的原理进行分析并指出其存在的问题,进而介绍随机森林算法。同单机环境下的随机森林构造不同的是,分布式环境下的决策树构建如果不进行优化的话,会带来大量的网络 IO操作,算法效率将非常低,为此本文给出了随机森林在分布式环境下的具体优化策略,然后对其源码进行分析,最后通过案例介绍随机森林在金融领域内如何进行优质客户的分类。Spark内存计算框架在大数据处理领域内占有举足轻重的地位,2014 年Spark风靡IT界,Twitter数据显示Spark已经超越
用户评论