1. 首页
  2. 编程语言
  3. Python
  4. 用Python自动下载网站所有文件

用Python自动下载网站所有文件

上传者: 2021-07-03 02:29:59上传 PDF文件 142.50 KB 热度 19次

按照自顶向下来设计程序,我们整理自己的思路,然后使用 Python 语言来翻译下即可。递归代码必须要有退出条件,退出条件要放在前面,本例中的递归退出条件就是:如果是文件就下载,下载完递归函数即完成任务。总体思路:1、给定一个 url,判断是否是文件,如果是文件,下载即可,然后函数结束。这里有个小坑,就是网站有个链接是返回上级页面的,url 的后辍是 '../' 这样的链接要去掉,否则递归函数就限入了死循环。另外,每下载成功一个文件,就把对应的 url 也保存在文件中或数据库中,如果一级 url 下的链接已经下载过文件,那么就不需要重新下载了。

下载地址
用户评论