1. 首页
  2. 行业
  3. 互联网
  4. 一种基于文本抽取的网页正文去重算法

一种基于文本抽取的网页正文去重算法

上传者: 2020-08-19 07:28:01上传 PDF文件 184.47KB 热度 16次
搜索结果页面的去重处理是提高网页检索结果质量的有效途径,笔者结合二叉排序树设计了一种基于文本抽取的网页正文去重 算法,本文给出了该算法的具体实现。实验测试结果表明该算法在判断准确率、时间复杂度方面均具有一定优势,可应用于网络信息检索结果 优化处理中的页面正文内容去重。
用户评论