使用VarCrunch在Hadoop上处理BAM/SAM文件进行变体调用
VarCrunch 是一种专为 生殖系 和 体细胞变异调用 而设计的程序,它依托 Apache Crunch 和 Guacamole,通过 Hadoop MapReduce 在大规模分布式环境中处理 DNA测序读取。 VarCrunch 主要功能包括以下几个方面:
-
生殖系变体调用 (germline):标准的生殖系变异调用算法。
-
读取深度分布计算 (readdepth-hist):生成读取深度的分布。
-
读取深度区间计算 (readdepth-intervals):计算给定区间大小的读取深度。
使用方式:
-
构建命令:mvn -DskipTests=true
。
-
运行命令:yarn jar yarn-* -job.jar
。
提示:有效的程序名称包括:germline
、readdepth-hist
和 readdepth-intervals
。
构建命令:mvn -DskipTests=true
。
运行命令:yarn jar yarn-* -job.jar
。
提示:有效的程序名称包括:germline
、readdepth-hist
和 readdepth-intervals
。
下载地址
用户评论