Snoopy 2.0 PHP爬虫
Snoopy是一个php类,用来模仿web浏览器的功能,它能完成获取网页内容和发送表单的任务。Snoopy的一些特点:
*方便抓取网页的内容
*方便抓取网页的文本内容(去除HTML标签)
*方便抓取网页的链接
*支持代理主机
*支持基本的用户名/密码验证
*支持设置user_agent,referer(来路),cookies和headercontent(头文件)
*支持浏览器转向,并能控制转向深度
*能把网页中的链接扩展成高质量的url(默认)
*方便提交数据并且获取返回值
*支持跟踪HTML框架(v0.92增加)
*支持再转向的时候传
下载地址
用户评论
感谢,不过分太要多了。