1. 首页
  2. 大数据
  3. spark
  4. Spark2.0新特性

Spark2.0新特性

上传者: 2019-04-17 04:11:48上传 DOCX文件 259.15KB 热度 18次
* 通过whole-stage code generation(全流程代码生成)技术将spark sql和dataset的性能提升2~10倍 * 通过vectorization(向量化)技术提升parquet文件的扫描吞吐量 * 提升orc文件的读写性能 * 提升catalyst查询优化器的性能 * 通过native实现方式提升窗口函数的性能 * 对某些数据源进行自动文件合并
下载地址
用户评论