1. 首页
  2. 编程语言
  3. Python
  4. python自动打开浏览器下载zip并提取内容写入excel

python自动打开浏览器下载zip并提取内容写入excel

上传者: 2021-06-13 00:56:55上传 PDF文件 478.96 KB 热度 20次

代码解释用selenium库访问目标页面,我这里通过_get_files_url方法定位输入框和超链接地址,然后返回超链接地址。之后在download_save方法内通过request.get拿到文件,然后存在本地,里面的一些存放目录、文件名处理等细节看代码就可以了。提取内容并填写使用到的库这部分用到time,xlwt,urllib,re,pickle,os,zipfile,BeautifulSoup这几个库。解压出来的文件比较冗杂,所以我用正则匹配了一个最合适的文件,这部分代码中的大部分工作都是为了拿到我的目标值,也就是,信息写入excel的过程倒不是很复杂。我基本上没有解释方法是因为这些百度一下或者看官网就行了,主要还是阐述一下我的编写思路

下载地址
用户评论