1. 首页
  2. 数据库
  3. 其它
  4. 大数据开发之走进MapReduce

大数据开发之走进MapReduce

上传者: 2021-02-07 07:05:39上传 PDF文件 423.92KB 热度 21次
MapReduce是一种可用于数据处理的编程模型。该模型比较简单,但要想写出有用的程序却不太容易。Hadoop可以运行各种语言版本的MapReduce程序。在本章中,我们将看到同一个程序的Java、Ruby、Python和C++语言版本。最重要的是,MapReduce程序本质上是并行运行的,因此可以将大规模的数据分析任务分发给任何一个拥有足够多机器的数据中心。MapReduce的优势在于处理大规模数据集,所以这里先来看一个数据集。在我们的例子里,要写一个挖掘气象数据的程序。分布在全球各地的很多气象传感器每隔一小时收集气象数据和收集大量日志数据,这些数据是半结构化数据且是按照记录方式存储的,因此
用户评论