1. 首页
  2. 编程语言
  3. Python
  4. python 爬取小说并下载的示例

python 爬取小说并下载的示例

上传者: 2022-07-19 02:21:27上传 PDF文件 73.24 KB 热度 20次

下载完成,实际花费了 27 分钟。想提速,可以使用多进程,大幅提高下载速度。如果使用分布式,甚至可以1秒钟内下载完毕。但是,我不建议这样做。以我们这次下载小说的代码为例,每秒钟下载 1 个章节,服务器承受的压力大约 1qps,意思就是,一秒钟请求一次。如果服务器资源不足,这个并发量足以一瞬间将服务器“打死”,特别是一些小网站,都很脆弱。过大并发量的爬虫程序,相当于发起了一次 CC 攻击,并不是所有网站都能承受百万级别并发量的。所以,写爬虫,一定要谨慎,勿给服务器增加过多的压力,满足我们的获取数据的需求,这就够了。你好,我也好,大家好才是真的好。

用户评论