parquet index:Parquet表的Spark SQL索引 源码
实木复合地板指数 Parquet表的Spark SQL索引 总览 包允许为Parquet表创建索引(作为和),以减少在Spark SQL中用于几乎交互式分析或点查询时的查询延迟。 它设计用于表不经常更改但经常用于查询的用例,例如使用Thrift JDBC / ODBC服务器。 建立索引后,架构和文件列表(包括分区)将自动从索引元存储中解析,而不是每次创建数据源时都推断架构。 项目是实验性的。 欢迎任何反馈,问题或PR。 文档反映了master分支中的更改,有关特定版本的文档,请选择相应的版本标签或分支。 元商店 Metastore保留有关所有索引表的信息,并且可以在本地文件系统或HDFS(
用户评论