1. 首页
  2. 移动开发
  3. 其他
  4. 专用Web信息收集系统的设计和实现

专用Web信息收集系统的设计和实现

上传者: 2020-07-25 11:51:50上传 PDF文件 148.05KB 热度 9次
Heritrix是由Java开发的开源Web网络爬虫,HTMLParser技术对抓取后网页内容进行高效率解析,对信息进行再一次整合,很好的解决了专业搜索引擎所需数据来源问题。文章探讨了基于Heritrix和HTMLParser构建Web信息收集系统的设计和实现。
用户评论