1. 首页
  2. 数据库
  3. 其它
  4. Hadoop中的Python框架的使用指南

Hadoop中的Python框架的使用指南

上传者: 2020-12-31 09:06:45上传 PDF文件 247.96KB 热度 15次
最近,我加入了Cloudera,在这之前,我在计算生物学/基因组学上已经工作了差不多10年。我的分析工作主要是利用Python语言和它很棒的科学计算栈来进行的。但Apache Hadoop的生态系统大部分都是用Java来实现的,也是为Java准备的,这让我很恼火。所以,我的头等大事变成了寻找一些Python可以用的Hadoop框架。 在这篇文章里,我会把我个人对这些框架的一些无关科学的看法写下来,这些框架包括: Hadoop流 mrjob dumbo hadoopy pydoop 其它 最终,在我的看来,Hadoop的
用户评论