Spark源码系列(二)RDD详解

上传者：zhuangwujian 2021-02-01 10:23:17上传 PDF文件 123.78KB 热度 30次

上一章讲了Spark提交作业的过程,这一章我们要讲RDD。简单的讲,RDD就是Spark的input,知道input是啥吧,就是输入的数据。RDD的全名是ResilientDistributedDataset,意思是容错的分布式数据集,每一个RDD都会有5个特征:1、有一个分片列表。就是能被切分,和hadoop一样的,能够切分的数据才能并行计算。2、有一个函数计算每一个分片,这里指的是下面会提到的compute函数。3、对其他的RDD的依赖列表,依赖还具体分为宽依赖和窄依赖,但并不是所有的RDD都有依赖。4、可选:key-value型的RDD是根据哈希来分区的,类似于mapreduce当中

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

Spark源码系列二RDD详解

上一章讲了Spark提交作业的过程,这一章我们要讲RDD。简单的讲,RDD就是Spark的input...

大小：124KB | 2021-02-01 10:23:17
Spark RDD详解

常见疑问 Spark与Apache Hadoop有何关系? Spark是与Hadoop数据兼容的快速...

大小：163KB | 2021-01-15 16:28:47
playing with spark rdd Apache Spark RDD示例源码

玩火花rdd Apache Spark RDD示例示例,用于学习Spark RDD和DataSet ...

大小：15.93MB | 2021-04-07 07:55:09
Spark1.4.1RDD算子详解

结合代码详细描述RDD算子的执行流程，并配上执行流程图

大小：0B | 2019-09-19 07:38:45
Spark RDD介绍

一、概念 RDD(Resilient Distributed Datasets),弹性分布式数据集。...

大小：35KB | 2021-02-01 00:06:53
spark rdd api

spark rdd api pdf文档对spark平台的初学者应该有所帮助,欢迎大家下载一起交流...

大小：332KB | 2020-11-07 13:20:43
Spark RDD论文

SparkRDD论文

大小：0B | 2020-04-18 22:24:57
Spark RDD Instrocution

关于spark最基础的RDD的介绍，上课用的讲义，英文版。

大小：0B | 2019-08-19 14:24:01
spark API RDD

大小：0B | 2018-12-07 13:29:50
Spark RDD论文原文

Spark RDD original paper

大小：0B | 2019-06-26 21:34:13
Spark RDD是什么

Spark 的核心是建立在统一的抽象弹性分布式数据集(Resiliennt Distributed ...

大小：260KB | 2021-01-10 16:00:16
Spark学习RDD编码

RDD:弹性分布式数据集(ResilientDistributedDataset),是Spark对数...

大小：0B | 2020-05-29 08:41:13
Spark rdd简易教程

Spark rdd 简易教程

大小：2.83MB | 2021-05-10 20:52:42
Spark RDD.docx

Spark 的核心是建立在统一的抽象弹性分布式数据集(Resiliennt Distributed ...

大小：267KB | 2020-08-09 18:22:01
hbase rdd Spark RDD从HBase读取写入和删除源码

hbase-rdd:Spark RDD从HBase读取,写入和删除

大小：221KB | 2021-02-10 02:10:35
spark rdd论文翻译_中文_spark老汤

包含了spark rdd的原版英语论文以及spark老汤根据原版论文翻译的中文版论文，详细的介绍了s...

大小：0B | 2018-12-26 01:57:31