1. 首页
  2. 移动开发
  3. 其他
  4. 论文研究 Yarn架构下基于GA的Web日志挖掘技术.pdf

论文研究 Yarn架构下基于GA的Web日志挖掘技术.pdf

上传者: 2020-07-18 06:27:27上传 PDF文件 1.07MB 热度 36次
提出了一种面向TB级别日志文件挖掘需求的日志挖掘技术。采用MapReduce编程模型设计并实现了一种基于子种群联姻策略的GA,并部署到Yarn架构上,使Yarn架构与GA有效结合。在算法Partition阶段,采用Round-Robin策略代替原有的哈希方法,使各个子种群基因更加趋向均匀分布,增加了子种群收敛效率和结果准确性,同时均衡各个节点运行负载,提高了系统性能。经测试,应用该技术的挖掘结果平均准确度达到93%以上,效率提升接近33%。
下载地址
用户评论