1. 首页
  2. 数据库
  3. 其它
  4. 采集 58同城 房产数据信息 | Java爬虫 & Jsoup

采集 58同城 房产数据信息 | Java爬虫 & Jsoup

上传者: 2020-12-23 00:39:30上传 PDF文件 423.53KB 热度 18次
一个数据采集系统(通俗的说就是爬虫),用来采集 58同城 房产 | 郑州中的房屋数据。使用 Java 语言和Jsoup库编写,这里分享给大家。 最后采集的数据结果 CSV 文件保存的,如下所示 说明 功能都集中在 spider.get58 包的如下4个类中: App: 应用驱动程序,控制爬虫的启动/运行逻辑和日志打印等; CrawUtil: 爬虫爬取单元,爬取特定的 url 返回 html 对象; DomParse: 从 html dom 中解析出需要的数据; House: Pojo,存储需要的数据信息。 用到的 Maven 依赖如下: org.jsou
用户评论