1. 首页
  2. 数据库
  3. 其它
  4. wombat:具有优雅DSL的轻量级Ruby Web爬网程序可从页面提取结构化数据 源码

wombat:具有优雅DSL的轻量级Ruby Web爬网程序可从页面提取结构化数据 源码

上传者: 2021-02-17 10:34:19上传 ZIP文件 1.42MB 热度 8次
袋熊 带有优雅DSL的Web抓取工具,可解析来自网页的结构化数据。 用法: gem install wombat 抓取页面: 使用Wombat的最简单方法是调用Wombat.crawl并将其传递给一个块: require 'wombat' Wombat . crawl do base_url "https://www.github.com" path "/" headline xpath : "//h1" subheading css : "p.alt-lead" what_is ( { css : ".one-fourth h4" } , :list ) l
用户评论