1. 首页
  2. 数据库
  3. 其它
  4. 自写python爬图虫

自写python爬图虫

上传者: 2020-11-26 13:56:56上传 PY文件 5.1KB 热度 13次
爬取已存储网页目录中的缺失图片(部分),现已可爬带'http://','https://'和万维网网址开头的GIF|JPG|PNG|ICO的图片文件至同级目录downimages下;支撑一次执行程序,不同网页存储目录分布执行;支撑recovery恢复执行初始状态;伴有日志目录进行抓取文件的网址和成功或失败的记录。
用户评论