当完成测序的比对工作之后,我们得到了bam/sam文件。那么,如何得到reads的统计数据呢? 这有很多途径: 1.读取日志文件。对于bowtie的日志,其中会包括如下的描述: 31991083 re...
使用 Gblocks 提取保守序列
1. Gblocks 简介 Gblocks用于从多序列比对结果中提取保守位点,以利于下一步的进化分析。 在线说明文档:http://molevol.cmima.csic.es/castresana/G...
htseq-count使用方法和参数简要说明
htseq-count是一款用于reads计数的轻便软件,作者介绍说可以用于多种mapping软件的输出结果,而我则用于tophat2的输出文件做计数。不过貌似所有能转换为sam格式文件的输出都可以用...
进化树上Bootstrap和Identity区别
Bootstrap,即自展值,是用来检验你所计算的进化树分支可信度的。简单地讲就是把序列的位点都重排,重排后的序列再用相同的办法构树,如果原来树的分枝在重排后构的树中也出现了,就给这个分枝打上一分,如...
使用 rfam 进行 ncRNA 注释
1. rfam 简介 Rfam 是一个数据库,用于鉴定 non-coding RNAs。 其官网:http://rfam.sanger.ac.uk。 其参考文献:Rfam 11.0: 10 years...
交叉验证(Cross-validation)
交叉验证是一种用来评价一个统计分析的结果是否可以推广到一个独立的数据集上的技术。主要用于预测,即,想要估计一个预测模型的实际应用中的准确度。它是一种统计学上将数据样本切割成较小子集的实用方法。于是可以...