【絮语】提交序列常见有两种方式,一种是Bankit ,另一种是Sequin,前者适合少量序列,后者则适合批量的序列。很多新人对 Sequin 望而却步,其实只要做好序列提交的三个文件准备工作,提交序列...
利用bioperl读取复杂序列
Genbank序列描述的内容就非常丰富(类似的还有SwissProt,EMBL等格式的序列),除了名称、描述和序列字符串以外还有序列号、形状(线状还是环状?)、发布日期、所属物种以及序列内包含的基因、...
DDBJ/EMBL/GenBank Accession的命名规则
The format for GenBank Accession numbers are: GenBank Accession numbers命名的规则是: Nucleotide: 1 letter ...
GenBank数据库格式的说明
GenBank是美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核酸以及蛋白质序列。每个记录代表了一个单独的、连续的、带有注释的DNA或RNA片段。这些文件按类别分为几组:有些按照系统发...
DNA各种序列格式介绍
1.Plain格式 A sequence in plain format may contain only IUPAC characters and spaces (no numbers!). Not...
利用BioJava根据物种属性过滤序列
GenBank,SwissProt和EMBL文件中物种属性是一条注释。所有要做的工作就是检查序列注释信息看看物种属性是否符合要求物种属性的名称依赖于数据源,在EMBL,SwissProt中用"OS"表...
利用BioJava读取一个GenBank,SwissProt,EMBL文件
SeqIOTools类包含了读取GenBank,SwissProt,EMBL文件的方法。因为文件中包含了不止一条序列,所以SeqIOTools返回一个序列遍历器(SequenceIterator)能够...