详细的安装及配置步骤请参见iprscan的文档Installing_InterProScan.txt 1.在安装iprscan之前,你的linux系统需要如下基本组件: PERL,这个常见的linux...
interproscan的用法
直接iprscan是不行的,需要加个-cli才能正常运行,不然出现一大堆HTML的代码,这里的cli 是command-line interface 简写。 usage: ./iprscan -cli...
SOAPdenovo拼接参数详解
1. kmer值 kmer值哪个比较好很难说,对不同的数据,用不同的kmer值会有很不同的结果。最好的办法就是测试不同的kmer,然后看结果的N50,找到N50最高的kmer。不过SOAPdenovo...
C++string类常用函数
string类的构造函数: [code lang="cpp"] string(const char *s); //用c字符串s初始化 string(int n,char c); //用n个字符c初始化...
得分矩阵PAM与BLOSUM的比较与区别
对于蛋白质序列,计分矩阵主要用于记录在做序列比对时两个相对应的残基的相似度,一旦这个矩阵定义好了以后,比对程式就可以利用这个矩阵,尽量将相似的残基排在一起,以达到最好的比对。 得分矩阵主要有两种,第一...
合并454和Solexa拼接结果的contig
用454测序得到的序列用newbler拼接的效果最好,而用短序列拼接软件velvet拼接效果很差,所以不能将454的原始reads和Illumina产生的reads合到一起后用velvet进行拼接。在...
SolexaQA:Illumina/Solexa测序Reads质量评估及分析软件
SolexaQA 是一个基于unix开发的perl脚本程序,用于Solexa 测序的Reads质量评估以及低质量Reads过滤。 SolexaQA 从Fastq文件统计rea...
利用BioJava根据物种属性过滤序列
GenBank,SwissProt和EMBL文件中物种属性是一条注释。所有要做的工作就是检查序列注释信息看看物种属性是否符合要求物种属性的名称依赖于数据源,在EMBL,SwissProt中用"OS"表...
利用BioJava列出序列中的注释
当你读取象GenBank或EMBL这样的序列注释文件时,文件提供的不仅仅是序列本身还有一些更细节的序列信息。如果这个信息拥有位置的话,就可以当作是特征。如果这个信息是很通用的信息比如说是物种名称的话,...
利用BioJava定制一个范围位置(RangeLocation)
在Biojava中范围位置对象代表标志链中一段区域,由唯一的起始和终止来定义。 下面的例子展示了范围位置。 [code lang="java"] import org.biojava.bio.symb...