《Learning Scrapy》中文版.pdf
通过python学习高效的web抓取和爬行的艺术,从任何来源提取数据来执行实时分析。充满技术和例子,以帮助您爬行网站和提取数据在几个小时内。如果你是一名软件开发人员、数据科学家、NLP或机器学习爱好者,或者只是需要将公司的wiki从一个遗留平台迁移过来,那么这本书就是为你准备的。它非常适合那些需要立即轻松访问大量半结构化数据的人。你将学会什么?理解HTML页面和编写XPath来提取你需要的数据用简单的Python编写杂乱的爬行器,并做网络爬虫把你的数据注入任何数据库,搜索引擎或分析系统配置你的爬行器来下载文件,图片和使用proxiesCreate有效的管道形状数据的形式你wantUse扭曲的异
用户评论