1. 首页
  2. 数据库
  3. 其它
  4. arche:分析抓取的数据 源码

arche:分析抓取的数据 源码

上传者: 2021-02-06 21:33:45上传 ZIP文件 3.37MB 热度 13次
拱门 pip install arche Arche(发音为Arkey )有助于使用一组已定义的规则来验证刮取的数据,例如: 验证 覆盖范围(项目,字段,分类数据,包括布尔值和枚举) 重复项 垃圾符号 两个工作的比较 除了其他工具,我们还在Scrapinghub中使用了它,以确保抓取数据的质量 安装 Arche需要环境,同时支持和 UI 对于JupyterLab,您将需要正确安装 然后只需pip install arche 为什么 连续检查抓取数据的质量。 例如,如果您抓取了一个网站,则典型的方法是使用Arche验证数​​据。 您还可以创建一个架构,然后设置 开发人员设定 pipenv
下载地址
用户评论