生物信息学教程系列 第二章 2 生物信息数据库与查询 近年来大量生物学实验的数据积累,形成了当前数以百计的生物信息数据库。它们各自按一定的目标收集和整理生物学实验数据,并提供相关的数据查询、数据处理的...
GenBank数据库格式的说明
GenBank是美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核酸以及蛋白质序列。每个记录代表了一个单独的、连续的、带有注释的DNA或RNA片段。这些文件按类别分为几组:有些按照系统发...
DNA各种序列格式介绍
1.Plain格式 A sequence in plain format may contain only IUPAC characters and spaces (no numbers!). Not...
利用BioJava根据物种属性过滤序列
GenBank,SwissProt和EMBL文件中物种属性是一条注释。所有要做的工作就是检查序列注释信息看看物种属性是否符合要求物种属性的名称依赖于数据源,在EMBL,SwissProt中用"OS"表...
利用BioJava列出序列中的注释
当你读取象GenBank或EMBL这样的序列注释文件时,文件提供的不仅仅是序列本身还有一些更细节的序列信息。如果这个信息拥有位置的话,就可以当作是特征。如果这个信息是很通用的信息比如说是物种名称的话,...
利用BioJava读取一个GenBank,SwissProt,EMBL文件
SeqIOTools类包含了读取GenBank,SwissProt,EMBL文件的方法。因为文件中包含了不止一条序列,所以SeqIOTools返回一个序列遍历器(SequenceIterator)能够...