1. 首页
  2. 编程语言
  3. 其他
  4. 开发基于Nutch的集群式搜索引擎

开发基于Nutch的集群式搜索引擎

上传者: 2019-01-08 23:49:38上传 WORD文件 327KB 热度 26次
介绍 Nutch 的背景知识,包括 Nutch 架构,爬虫和搜索器。然后以开发一个基于 Nutch 的实际应用为例向读者展示如何使用 Nutch 开发自己的搜索引擎。在该示例中,首先带领读者开发一个作为 Nutch 爬虫抓取的目标网站,目标网站将被部署在域名为 myNutch.com 的服务器上。然后示例说明 Nutch 爬虫如何抓取目标网站内容,产生片断和索引,并将结果存放在集群的2个节点上。最后使用 Nutch 检索器提供的 API 开发应用,为用户提供搜索接口。
用户评论