GenomicsDB:C ++中的高性能数据存储用于导入查询和转换带有CC ++ JavaSpark绑定的变体数据。 在gatk4中使用 源码
主 开发 GenomicsDB(最初来自 )建立在和基于图块的阵列存储系统的基础上,用于导入,查询和转换变体数据。 变异数据本质上是稀疏的(相对于整个基因组稀疏),并且使用稀疏数组数据存储非常适合存储此类数据。 GenomicsDB是用C ++编写的高性能可扩展数据存储,用于导入,查询和转换基因组变异数据。 支持的平台:Linux和MacOS。 支持的文件系统:POSIX,HDFS,EMRFS(S3),GCS和Azure Blob。 包括 JVM / Spark包装器,除其他功能外,还允许将缓冲区与C ++层进行流传输。 带有本机库且仅zlib依赖项的GenomicsDB jar定期在
下载地址
用户评论