1. 首页
  2. 数据库
  3. MySQL
  4. Python 爬虫性能相关总结

Python 爬虫性能相关总结

上传者: 2020-09-20 23:09:11上传 PDF文件 60.99KB 热度 30次

这里我们通过请求网页例子来一步步理解爬虫性能当我们有一个列表存放了一些url需要我们获取相关数据,我们首先想到的是循环这一种方法相对来说是最慢的,因为一个一个循环,耗时是最长的,是所有的时间总和通过线程池的方式访问,这样整体的耗时是所有连接里耗时最久的那个,相对循环来说快了很多这里定义了一个回调函数callback通过进程池的方式访问,同样的也是取决于耗时最长的,但是相对于线程来说,进程需要耗费更多的资源,同时这里是访问url时IO操作,所以这里线程池比进程池更好这种方式和线程+回调函数的效果是一样的,相对来说开进程比开线程浪费资源主流的单线程实现并发的几种方式

用户评论