1. 首页
  2. 数据库
  3. 其它
  4. Python实现的异步代理爬虫及代理池

Python实现的异步代理爬虫及代理池

上传者: 2021-02-25 21:00:15上传 PDF文件 317.75KB 热度 15次
使用python asyncio实现了一个异步代理池,根据规则爬取代理网站上的免费代理,在验证其有效后存入redis中,定期扩展代理的数量并检验池中代理的有效性,移除失效的代理。同时用aiohttp实现了一个server,其他的程序可以通过访问相应的url来从代理池中获取代理。 源码 Github 环境 Python 3.5+ Redis PhantomJS(可选) Supervisord(可选) 因为代码中大量使用了asyncio的async和await语法,它们是在Python3.5中才提供的,所以最好使用Python3.5及以上的版本,我使用的是Python3.6。 依赖
用户评论