1. 首页
  2. 编程语言
  3. Python
  4. python爬虫指南

python爬虫指南

上传者: 2020-05-18 00:45:25上传 PDF文件 9.87MB 热度 27次
使用Python来爬取网络数据,讲解了从静态页面爬取数据的方法以及使用缓存来管理服务器负载的方法。此外,本书还介绍了如何使用AJAXURL和Firebug扩展来爬取数据,以及有关爬取技术的更多真相,比如使用浏览器渲染、管理cookie、通过提交表单从受验证码保护的复杂网站中抽取数据等。本书使用Scrapy创建了一个高级网络爬虫,并对一些真实的网站进行了爬取。
下载地址
用户评论