论文研究Web信息抽取技术综述.pdf 上传者:CSDN阿坤 2020-04-22 11:53:27上传 UNKONW文件 500kb 热度 47次 快速高效地获取网页主题信息的需求使得Web信息抽取技术成为信息技术领域的研究热点。现有的Web信息抽取技术大致可以归纳为基于统计理论的、基于视觉特征的、基于DOM树结构的和基于模板的几类。由于网页文本本身具有树结构并且具有一定的相似性,基于DOM树结构和基于模板的抽取技术发展很快而且已经得到了广泛的应用。分别论述了上述几类技术在近几年来的研究进展,从自动化程度、适用范围和复杂性三个角度分析对比了几类技术的优缺点。 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论