holoclean:一种用于数据丰富的机器学习系统 源码
掌握: 开发人员: HoloClean:用于数据丰富的机器学习系统 建立在PyTorch和PostgreSQL之上。 HoloClean是一个统计推断引擎,用于估算,清理和丰富数据。 作为一个缺乏监督的机器学习系统,HoloClean利用可用的质量规则,值相关性,参考数据和其他多种信号来构建概率模型,以准确地捕获数据生成过程,并在各种数据管理任务中使用该模型。 HoloClean允许数据从业者和科学家节省大量时间,用于构建零碎的清洁解决方案,而是以声明性的方式有效地交流其领域知识,从而能够从嘈杂,不完整和错误的数据中进行准确的分析,预测和见解。 安装 HoloClean已在Python 2.7、3.6和3.7版上进行了测试。 它需要PostgreSQL 9.4或更高版本。 1.安装和配置PostgreSQL 我们描述了如何安装PostgreSQL并为HoloClean配置Postgre
用户评论