1. 首页
  2. 编程语言
  3. Python
  4. 《用Python写网络爬虫》-[澳]理查德 劳森(Richard Lawson)

《用Python写网络爬虫》-[澳]理查德 劳森(Richard Lawson)

上传者: 2019-06-04 21:16:15上传 PDF文件 9.87MB 热度 39次
《用Python写网络爬虫》介绍了如下内容:通过跟踪链接来爬取网站;使用lxml从页面中抽取数据;构建线程爬虫来并行爬取页面;将下载的内容进行缓存,以降低带宽消耗;解析依赖于JavaScript的网站;与表单和会话进行交互;解决受保护页面的验证码问题;对AJAX调用进行逆向工程;使用Scrapy创建高级爬虫。
用户评论