厚皮:大规模可再生数据科学! 源码
Pachyderm:数据版本控制,数据管道和数据沿袭 Pachyderm是用于生产数据管道的工具。 如果您需要以理智的方式将数据抓取,提取,清理,整理,整理,处理,建模和分析链接在一起,那么Pachyderm就是您的理想选择。 如果您有一组以临时方式执行此操作的脚本,并且您正在寻找一种“生产”它们的方法,那么Pachyderm可以使您轻松实现这一点。 产品特点 容器化:Pachyderm基于Docker和Kubernetes构建。 无论您的管道需要哪种语言或库,它们都可以在Pachyderm上运行,而Pachyderm可以轻松地部署在任何云提供商或Prem上。 版本控制:Pachyderm版
下载地址
用户评论