1. 首页
  2. 编程语言
  3. Web开发
  4. 基于Web的专用爬虫的研究.pdf

基于Web的专用爬虫的研究.pdf

上传者: 2019-10-19 10:22:43上传 PDF文件 229.31KB 热度 26次
网络爬虫是全文搜索引擎系统的核心模块,它实现对站内信息的检索和特定Web信息的搜索。然而,万维网规模越来越巨大,产生了专业爬虫。主要研究了怎样建立一个有效的专用爬虫,它可以自动发现和下载用户感兴趣的页面。包括的内容:超文本分类器、提取器、爬虫的基本功能、数据存储及核心算法。
用户评论