1. 首页
  2. 编程语言
  3. Java
  4. 基于Hadoop平台实现一个分布式网络爬虫

基于Hadoop平台实现一个分布式网络爬虫

上传者: 2019-07-09 18:44:19上传 PDF文件 2.31MB 热度 53次
基于Hadoop实现一个分布式网络爬虫系统的理论描述
下载地址
用户评论
码姐姐匿名网友 2019-07-09 18:44:19

不错资源,值得学习

码姐姐匿名网友 2019-07-09 18:44:19

文档不错,有代码就更好了

码姐姐匿名网友 2019-07-09 18:44:19

论文写的很不错,要是能分享一下源码就更好了

码姐姐匿名网友 2019-07-09 18:44:19

布隆过滤器很新颖,论文中没有提到反网站反爬虫机制的策略,另外,只是用学院的网站做了测试,代表性不强。

码姐姐匿名网友 2019-07-09 18:44:19

很不错的资源,非常值得,谢谢分享