1. 首页
  2. 行业
  3. 交通
  4. scrapy redis分布式爬虫的搭建过程(理论篇)

scrapy redis分布式爬虫的搭建过程(理论篇)

上传者: 2020-12-17 06:48:06上传 PDF文件 664.73KB 热度 7次
1. 背景 Scrapy 是一个通用的爬虫框架,但是不支持分布式,Scrapy-redis是为了更方便地实现Scrapy分布式爬取,而提供了一些以redis为基础的组件(仅有组件)。 2. 环境 系统:win7 scrapy-redis redis 3.0.5 python 3.6.1 3. 原理 3.1. 对比一下scrapy 和 Scrapy-redis 的架构图。 scrapy架构图: scrapy-redis 架构图: 多了一个redis组件,主要影响两个地方:第一个是调度器。第二个是数据的处理。 3.2. Scrapy-Redis分布式策略。 作为一
用户评论