1. 首页
  2. 编程语言
  3. 其他
  4. Apache Nutch v2.3.1

Apache Nutch v2.3.1

上传者: 2020-02-17 13:27:22上传 ZIP文件 7.24MB 热度 30次
Nutch的创始人是DougCutting,他同时也是Lucene、Hadoop和Avro开源项目的创始人。Nutch诞生于2002年8月,是Apache旗下的一个用Java实现的开源搜索引擎项目,自Nutch1.2版本之后,Nutch已经从搜索引擎演化为网络爬虫,接着Nutch进一步演化为两大分支版本:1.X和2.X,这两大分支最大的区别在于2.X对底层的数据存储进行了抽象以支持各种底层存储技术。在Nutch的进化过程中,产生了Hadoop、Tika、Gora和CrawlerCommons四个Java开源项目。如今这四个项目都发展迅速,极其火爆,尤其是Hadoop,其已成为大规模数据处理
用户评论