Crawler4j 3.5
1、对应Crawler4j的版本应该是3.5。 2、http://code.google.com/p/crawler4j -> Source -> Checkout上用Git Clone失败。 3、采用最笨的方法从 Source -> Browse上把文件一个一个拷贝下来,自己新建的Java项目,包结构一样,只是改了一下资源文件的位置:edu.uci.ics.crawler4j.url.TLDList 中 private final String tldNamesFileName = "resources/tld-names.txt"; 4、测试例只拷贝了第一个最简单的,其它的自行拷贝。测试通
用户评论
代码适合作为参考,还是不错的
代码不错,谢谢了
您好,我下载后将程序导入eclipse后出现问题了,好像有的包不能识别,这是什么情况?
这个爬虫能用、可以参考
还不错,适合代码参考。
代码不错,只可惜没有依赖库,适合学习
适合学习使用~
还好,可以用
code.google上不去,找了很久了,多谢