1. 首页
  2. 行业
  3. 物流
  4. 一种用于大规模数据集的决策树采样策略

一种用于大规模数据集的决策树采样策略

上传者: 2020-10-28 06:48:44上传 PDF文件 116.5KB 热度 9次
为提高大规模数据集生成树的准确率,提出一种预生成一棵基于这个数据集的决策树,采用广度优先遍历将其划分为满足预定义的限制的数据集,再对各数据集按照一定比例进行随机采样,最后将采样结果整合为目标数据集的数据采样方法。通过对一UCI数据集进行采样,并用现有决策树算法实验证明,该采样方法优于传统随机采样方法,基于该采样方法的生成树准确率有所提高。
下载地址
用户评论