1. 首页
  2. 大数据
  3. spark
  4. Spark实战.docx

Spark实战.docx

上传者: 2020-03-17 11:47:22上传 DOCX文件 496.62KB 热度 53次
1.Spark是特性 高可伸缩性 高容错 于内存计算 2.Spark的生态体系(BDAS,中文:伯利克分析栈) MapReduce属于Hadoop生态体系之一,Spark则属于BDAS生态体系之一 Hadoop包含了MapReduce、HDFS、HBase、Hive、Zookeeper、Pig、Sqoop等 BDAS包含了Spark、Shark(相当于Hive)、BlinkDB、SparkStreaming(消息实时处理框架,类似Storm)等等 3.Spark与MapReduce 优势: MapReduce通常将中间结果放到HDFS上,Spark是基于内存
用户评论