1. 首页
  2. 数据库
  3. 其它
  4. Python学习笔记——大数据之Spark简介与环境搭建

Python学习笔记——大数据之Spark简介与环境搭建

上传者: 2021-02-01 09:57:47上传 PDF文件 551.91KB 热度 13次
Spark是Apache顶级项目里面最火的大数据处理的计算引擎,它目前是负责大数据计算的工作。包括离线计算或交互式查询、数据挖掘算法、流式计算以及图计算等。 核心组件如下: SparkCore:包含Spark的基本功能;尤其是定义RDD的API、操作以及这两者上的动作。其他Spark的库都是构建在RDD和Spark Core之上的。 SparkSQL:提
用户评论