自己动手写网络爬虫.pdf 罗刚 王振东著
内容简介编辑
主要包括从互联网获取信息与提取信息和对Web信息挖掘等内容。本书在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。该书介绍了网络爬虫开发中的关键问题与关于Java实现的问题。[1]
本书适用于有Java程序设计基础的开发人员。同时也可以作为计算机相关专业本科生或研究生的参考教材。[2]
作品目录编辑
第1章全面剖析网络爬虫3
1.1抓取网页1.3.3使用berkeleydb构建爬虫队列示例
1.1.1深入理解url1.3.4使用布隆过滤器构建visited表
1.1.2通过指定的url抓取网页内容1.3.5详解h
下载地址
用户评论