1. 首页
  2. 数据库
  3. 其它
  4. 论文研究 基于正文结构和长句提取的网页去重算法 .pdf

论文研究 基于正文结构和长句提取的网页去重算法 .pdf

上传者: 2021-04-21 23:47:31上传 PDF文件 236.95KB 热度 13次
基于正文结构和长句提取的网页去重算法,黄仁,冯胜,爬虫搜集的重复网页不仅浪费了存储和带宽资源,而且增加了用户的浏览负担。针对网页重复的特点和网页正文的结构特征,提出了一种
下载地址
用户评论