1. 首页
  2. 数据库
  3. 其它
  4. 网络爬虫(一) 前言

网络爬虫(一) 前言

上传者: 2020-12-30 06:39:39上传 PDF文件 44KB 热度 12次
一、前言 1.1 网络爬虫简介 “网络爬虫”又称“网络蜘蛛”。是一种在互联网上自动采集数据的自动化程序,爬虫的规模可大可小,大到百度,谷歌搜索,小到自动下载图片等。 采集数据,所采集的数据是结构化的,批量提取,提高效率的。例如,我们希望在某电商平台上获取某产品相关信息,其中包含信息可能存在产品名称、产品价格、参评参数、广告、评论内容等,我们只想要其中的用户好评信息,其他的都不要,以表格形式保存,表格就是结构化以后的结果,如果该数据量较小的话我们可以手动复制粘贴,但当有 1000,100000 或更庞大的数据量时,显然复制粘贴效率就太低了还不能保证正确率,使用爬虫提取,正确率都,效率都得意保证,
下载地址
用户评论