基于Hadoop平台实现一个分布式网络爬虫
基于Hadoop实现一个分布式网络爬虫系统的理论描述
下载地址
用户评论
不错资源,值得学习
文档不错,有代码就更好了
论文写的很不错,要是能分享一下源码就更好了
布隆过滤器很新颖,论文中没有提到反网站反爬虫机制的策略,另外,只是用学院的网站做了测试,代表性不强。
很不错的资源,非常值得,谢谢分享