clinical_tcga 用于解析来自TCGA的临床元数据文件的库
**
为了从TCGA数据库中解析临床数据,你可以使用clinical_tcga
库。这个工具需要两个输入文件:一个包含样本ID列表的文件和一个列出需要提取的临床特征的文件。假设你有这两个文件,那么你还需要一个本地的数据库,比如制表符分隔的文件。执行命令如下:
create_clinical_matrix.rb -s samples.txt -f features.txt -d /path/to/db/Biotab/ -o outfile.csv
此命令将生成一个outfile.csv
文件,其中包含每个样本的特征矩阵,方便后续的解析和分析。假如你还需要将UUID转换为条形码ID,这个工具也能帮上忙!单个UUID可以这样转换:
convert_tcga_uuid.rb sample_uuid
而如果你有一长串UUID需要处理,可以一次性转换:
convert_tcga_uuid.rb -f uuid_list.txt
下载地址
用户评论