1. 首页
  2. 编程语言
  3. Python
  4. 用python爬虫批量下载pdf的实现

用python爬虫批量下载pdf的实现

上传者: 2022-05-05 09:21:24上传 PDF文件 62.04 KB 热度 49次

今天遇到一个任务,给一个excel文件,里面有500多个pdf文件的下载链接,需要把这些文件全部下载下来。我知道用python爬虫可以批量下载,不过之前没有接触过。今天下午找了下资料,终于成功搞定,免去了手动下载的烦恼。由于我搭建的python版本是3.5,我学习了上面列举的参考文献2中的代码,这里的版本为2.7,有些语法已经不适用了。我修正了部分语法,如下:上面这个例子是个很好的模板。当然,上面的还不适用于我的情况,我的做法是:先把地址写到了html文件中,然后对正则匹配部分做了些修改,我需要匹配的地址都是这样的,http://pm.zjsti.gov.cn/tempublicfiles/G176200001/G176200001.pdf。我参考了以下资料,这对我很有帮助:

下载地址
用户评论