1. 首页
  2. 数据库
  3. 其它
  4. Spark:一个高效的分布式计算系统

Spark:一个高效的分布式计算系统

上传者: 2021-02-01 16:07:37上传 PDF文件 305.76KB 热度 14次
Spark是UCBerkeleyAMPlab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于mapreduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法。其架构如下图所示:Spark的中
下载地址
用户评论