火车头采集器绿色版
一、数据抓取原理 火车采集器如何去抓取数据,取决于您的规则。您要获取一个栏目的网页里的所有内容,需要先将这个网页的网址采下来,这就是采网址。程序按您的规则抓取列表页面,从中分析出网址,然后再去抓取获得网址的网页里的内容。再根据您的采集规则,对下载到的网页分析,将标题内容等信息分离开来并保存下来。如果您选择了下载图片等网络资源,程序会对采集到的数据进行分析,找出图片,资源等的下载地址并下载到本地。 二、数据发布原理 在我们将数据采集下来后数据默认是保存在本地的,我们可以使用以下几种方式对数据进行处理。 1、不做任何处理。因为数据本身是保存在数据库的(access、db3、mysql、sqlser
用户评论
火车头太难学了 研究了下放弃。
解压要密码的呀,你玩大家啊?
对我来说用处不大