Spark实战.docx
1.Spark是特性
高可伸缩性
高容错
于内存计算
2.Spark的生态体系(BDAS,中文:伯利克分析栈)
MapReduce属于Hadoop生态体系之一,Spark则属于BDAS生态体系之一
Hadoop包含了MapReduce、HDFS、HBase、Hive、Zookeeper、Pig、Sqoop等
BDAS包含了Spark、Shark(相当于Hive)、BlinkDB、SparkStreaming(消息实时处理框架,类似Storm)等等
3.Spark与MapReduce
优势:
MapReduce通常将中间结果放到HDFS上,Spark是基于内存
用户评论