1. 首页
  2. 课程学习
  3. 讲义
  4. 大规模网页模块识别与信息提取系统设计与实现

大规模网页模块识别与信息提取系统设计与实现

上传者: 2019-03-12 05:06:26上传 PDF文件 1.51MB 热度 23次
大规模网页模块识别与信息提取系统设计与实现,朱磊同学的毕业设计工作属于天网搜索引擎预处理模块,提出了一套基于语义 的网页分块和主题内容信息提取算法,并在SEWM2008中文Web信息检索评测项 中得到检验。在该套算法基础上,还实现了基于Map-Reduce的分布式QuarkRank 算法。
用户评论