有时,在推断进化树的过程中,我们希望phylip格式的文件能够将序列的名称完整得保留下来。通常情况下,我们的名称会超过10字符, 而ClustalX和MUSCLE等软件给出的phylip文件是严格的p...
NCBI/DDBJ/EMBL序列的标识符:GI number和Accession.Version
GI number及Accession.Version就像是序列的身份证号码一样。通过这个号码,我们能在NCBI/DDBJ/EMBL等数据库查到该序列的数据。 问题: 为什么会有两种类型的序列标识符(...
GenBank数据库格式的说明
GenBank是美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核酸以及蛋白质序列。每个记录代表了一个单独的、连续的、带有注释的DNA或RNA片段。这些文件按类别分为几组:有些按照系统发...