1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究Web信息抽取技术综述.pdf

论文研究Web信息抽取技术综述.pdf

上传者: 2020-04-22 11:53:27上传 UNKONW文件 500kb 热度 18次
快速高效地获取网页主题信息的需求使得Web信息抽取技术成为信息技术领域的研究热点。现有的Web信息抽取技术大致可以归纳为基于统计理论的、基于视觉特征的、基于DOM树结构的和基于模板的几类。由于网页文本本身具有树结构并且具有一定的相似性,基于DOM树结构和基于模板的抽取技术发展很快而且已经得到了广泛的应用。分别论述了上述几类技术在近几年来的研究进展,从自动化程度、适用范围和复杂性三个角度分析对比了几类技术的优缺点。
用户评论