awesome opensource data engineering:很棒的开源数据工程项目清单 源码
很棒的开源数据工程 该旨在概述与数据工程相关项目。这是社区的努力:请并发送您的拉取请求,以增加此列表!有关包括非OSS工具的列表的信息,请参阅此令人惊叹的 。 目录 分析工具 用于大规模数据处理的统一分析引擎。包括Scala,Java,Python(称为PySpark)和R(SparkR)中的API。 -Google DataFlow的开源实现。提供在任何执行引擎(包括Spark,Flink或它自己的DirectRunner)上运行的批处理和流数据处理作业的功能。支持Java,Python和Go中的多个API。 数据流上的有状态计算。 商业情报 一个现代的,可用于企业的商业智能Web应用程序。 -Hadoop用户界面。与Superset类似,但在RDBMS,Hive,Impala,HBase,Spark,HDFS和S3,Oozie,Pig,YARN Job Explorer等接口
用户评论