multimodal dataset:用于生成多模式CAFA基准测试集的代码和最少数据源码

上传者：marketing_55952 2021-04-08 18:51:34上传 ZIP文件 28.77MB 热度 8次

多峰数据集代码,用于生成多模式基准测试集的最少数据。 1.选择样本进行培训,测试,验证阈值序列同一性,以避免基于同源性的过度拟合。为此,从获得.fasta格式的一组带注释的序列,并将其聚类(使用cdhit ),直到某个序列同一性阈值(例如40%)。聚类后,由每个聚类中的质心组成的蛋白质集即为完整数据集。这些蛋白质在.fasta的输出.fasta文件中cdhit 。将该数据集适当地划分为训练集,验证集和保持集。请记住,如果保持集是预先确定的,则必须删除其聚类中包含测试集成员的所有质心。这可以通过群集文件转换成一个相当容易做到.json使用scripts/convert_clstr_to_json.py并打开一个交互式python与重心会议.fasta文件和.json列表文件,并测试集列表。 2.下载结构,提取坐标中的序列中只有一个子集在具有关联的结构。可以通过将U

下载地址

用户评论

更多下载

下载地址

立即下载

收藏腾讯微博

用户评论

multimodal dataset用于生成多模式CAFA基准测试集的代码和最少数据源码

多峰数据集代码,用于生成多模式基准测试集的最少数据。 1.选择样本进行培训,测试,验证阈值序列同...

大小：28.77MB | 2021-04-08 18:51:34
multimodal cafa testset用于生成多模式CAFA基准测试集的代码和最少数据源码

多峰数据集代码,用于生成多目标CAFA基准测试集的最少数据。

大小：46.49MB | 2021-04-08 18:51:35
CodeSearchNet用于代码表示学习的数据集工具和基准源码

CodeSearchNet挑战已经结束我们要感谢所有参与者的提交,我们希望这一挑战能为从业者和研究...

大小：29.17MB | 2021-02-10 02:07:25
Dataset Java用于作业的Java数据集源码

Dataset-Java:用于作业的Java数据集

大小：498KB | 2021-04-07 14:00:34
易语言计算桃子最少数量源码

易语言计算桃子最少数量源码,计算桃子最少数量

大小：3KB | 2020-07-23 21:35:28
SingleCellMultiModal用于下载数据集的单细胞多模式数据脚本源码

单细胞多模态这是一个用于下载单细胞多模态数据并将其表示为MultiAssayExperiment对...

大小：62KB | 2021-02-09 15:02:29
Awesome Multimodal Research多模式相关研究的精选清单源码

很棒的多峰研究此回购由重新组织欢迎任何建议! 调查报告新闻 [01/2021] OpenAI:我...

大小：928.12MB | 2021-02-01 22:57:15
benchdb用于JMH基准测试结果的数据库和查询工具源码

benchdb-用于结果的数据库和查询工具当您使用JMH运行基准测试时,通常会查看运行后打印的结果...

大小：43KB | 2021-03-25 17:53:19
人体姿态基准用于在FLIC和LSP数据集上对人体姿态预测算法进行基准测试的评估工具源码

人体姿态基准:用于在FLIC和LSP数据集上对人体姿态预测算法进行基准测试的评估工具

大小：9.39MB | 2021-02-07 08:26:03
DreamyDatasets我用于测试的数据集源码

DreamyDatasets 我用于测试的数据集,每个大约10000行。 Cloud_Data_Ge...

大小：856KB | 2021-04-24 16:20:19

multimodal dataset:用于生成多模式CAFA基准测试集的代码和最少数据 源码

multimodal dataset:用于生成多模式CAFA基准测试集的代码和最少数据源码