1. 首页
  2. 编程语言
  3. Java
  4. 自己用java做的一个类似网页爬虫的东西

自己用java做的一个类似网页爬虫的东西

上传者: 2019-04-03 00:36:14上传 RAR文件 765KB 热度 38次
能实现整个网站的抓取,暂时还不支持javascript形式的连接 能抓取网页,网页中的所有的URL重新生成,图片,文件,包括所有格式的文件,全部都能保持原有的路径结构 抓取下的网页,通过apache搭建成网站,能在本地保持成一个完整的网站的形式 能直接使用,也能支持二次开发使用,不过暂时还会存在比较多的不完善的地方. 提供内置线程,能控制抓取操作执行的时间,循环执行 东西还不是很完善,欢迎大家提出意见
用户评论
码姐姐匿名网友 2019-04-03 00:36:14

不能使用啊

码姐姐匿名网友 2019-04-03 00:36:14

不错,根据自己的实际情况再稍加修改就可以用了。

码姐姐匿名网友 2019-04-03 00:36:14

存在乱码问题,撮合能用。

码姐姐匿名网友 2019-04-03 00:36:14

代码很乱。。都是html文件。。我都不知道怎么下手。。

码姐姐匿名网友 2019-04-03 00:36:14

好不错,可以参考

码姐姐匿名网友 2019-04-03 00:36:14

可能是我基础比较差,看不太懂

码姐姐匿名网友 2019-04-03 00:36:14

有问题,不能使用

码姐姐匿名网友 2019-04-03 00:36:14

用起来好像很复杂的额样子

码姐姐匿名网友 2019-04-03 00:36:14

楼主需要重新编写,貌似不能使用好像不能使用。