1. 首页
  2. 数据库
  3. 其它
  4. Spark SQL常见4种数据源详解

Spark SQL常见4种数据源详解

上传者: 2021-02-27 06:37:28上传 PDF文件 88.94KB 热度 8次
通用load/write方法 手动指定选项 Spark SQL的DataFrame接口支持多种数据源的操作。一个DataFrame可以进行RDDs方式的操作,也可以被注册为临时表。把DataFrame注册为临时表之后,就可以对该DataFrame执行SQL查询。 Spark SQL的默认数据源为Parquet格式。数据源为Parquet文件时,Spark SQL可以方便的执行所有的操作。 修改配置项spark.sql.sources.default,可修改默认数据源格式。 scala> val df = spark.read.load(hdfs://hadoop001:9000/nam
下载地址
用户评论