1. 首页
  2. 数据库
  3. 其它
  4. Assembly Dereplicator:用于从一组程序集中删除冗余基因组的工具 源码

Assembly Dereplicator:用于从一组程序集中删除冗余基因组的工具 源码

上传者: 2021-03-19 08:46:39上传 ZIP文件 241KB 热度 5次
程序集去复制器 Ryan R.Wick 1和Kathryn E.Holt 1,2 1.莫纳什大学中央临床学院传染病系,澳大利亚维多利亚州墨尔本3004 2.英国伦敦卫生与热带医学学院,伦敦WC1E 7HT,英国 目录 介绍 此存储库包含一个独立的Python脚本( ),用于解决我偶尔遇到的一个问题:重复复制一组细菌基因组程序集。 去复制意味着删除具有足够近亲(由距离阈值定义)的组件,从而在组件更独特的情况下得到较小的集合。 例如,假设您有一个特定分类单元的10000个基因组装配体,并且想要对其进行一些分析,也许是构建一个泛基因组。 您知道这组中存在冗余,因为某些基因组来自暴发并且彼此几乎相同。 因此,您可以对所有10000个程序集进行分析,而无需将它们重复复制到较小的集合中(例如,删除几乎相同的冗余基因组),这样您的分析将更快。 要求 您需要Python 3.5或更高版本才能运行der
下载地址
用户评论