1. 首页
  2. 数据库
  3. 其它
  4. miniparquet:读取Parquet文件子集的库 源码

miniparquet:读取Parquet文件子集的库 源码

上传者: 2021-04-04 18:33:13上传 ZIP文件 200.68KB 热度 17次
迷你实木复合地板 miniparquet是Parquet文件常见子集的阅读器。 miniparquet仅支持矩形数据结构(无嵌套表),仅支持Snappy压缩方案。 miniparquet没有(零,无,0),并且非常轻巧。 它可以在几秒钟内编译为1 MB以下的二进制大小。 安装 Miniparquet是C ++库,一个Python包和一个R包。 像这样安装R软件包: devtools::install_github("hannesmuehleisen/miniparquet") 可以通过键入make来构建C ++库。 使用python setup.py install来安装Python软件包。 用法 像这样使用R包: df <- miniparquet::parquet_read("example.parquet") 结构类似的Parquet文件的文件夹(例如,由Spark生成)可
用户评论