SparkSql技术
目录 一:为什么sparkSQL? 3 1.1:sparkSQL的发展历程 3 1.1.1:hive and shark 3 1.1.2:Shark和sparkSQL 4 1.2:sparkSQL的性能 5 1.2.1:内存列存储(In-Memory Columnar Storage) 6 1.2.2:字节码生成技术(bytecode generation,即CG) 6 1.2.3:scala代码优化 7 二:sparkSQL运行架构 8 2.1:Tree和Rule 9 2.1.1:Tree 10 2.1.2:Rule 10 2.2:sqlContext的运行过程 12 2.3:hiveCon
下载地址
用户评论
这篇文章对于SparkSql的优缺点进行了中肯的评述,让我更全面地了解了这项技术。
读了这个文件后,我终于明白了SparkSql的核心概念和基本用法,对我学习数据分析有很大帮助。
这个文件不仅讲解了SparkSql的基本知识,还给出了一些优化的建议,非常适合有一定经验的开发者参考。
文件中提供的案例对于我理解SparkSql的实际应用非常有帮助,让我对数据处理的流程有了更具体的认识。
这个文件很详尽地介绍了SparkSql技术,对于想快速入门的人来说非常有帮助。