1. 首页
  2. 编程语言
  3. 其他
  4. 开源数据质量解决方案ApacheGriffin.zip

开源数据质量解决方案ApacheGriffin.zip

上传者: 2019-07-29 18:38:02上传 ZIP文件 7.14MB 热度 19次
ApacheGriffin是一个应用于分布式数据系统中的开源数据质量解决方案。在Hadoop,Spark,Storm等分布式系统中,提供了一整套统一的流程来定义和检测数据集的质量并及时报告问题。 ApacheGriffin填补了开源世界里在大数据质量领域的空白。就像空气质量,水和食品安全等无时不刻地在影响人类的生命一样,数据质量在数据科学领域是至关重要的。在大数据时代,企业决策调整,商机发现等越来越依赖于大数据的数据分析和数据挖掘,而数据质量的保证是所有一切数据分析和数据挖掘的基础。系统架构:核心优势:主要功能:企业应用:Apache Griffin已经部署在eBay的生产环境中,为eBay系统提供核心数据质量检测服务(例如:实时的个性化数据平台,
用户评论