MapReduce-课程这个存储库保存了我们在CMU的Hadoop和MapReduce (95-869)中所做的项目。我们希望这些项目中的想法可以提供一些见解。请注意,我们利用了项目1中来自互联网的词干类;来自Hadoop: The Definitive Guide中的示例代码的解析器类和WholeFileInputFormat类,分别位于项目2和项目4中;和项目3中来自LingPipe的DynamicLMClassifier类。由于LingPipe的发布许可,项目3在AGPL许可下共享。考虑到每个项目可以单独工作,其余项目的许可证尚未确定。