Bioinformatics

统计BAM文件中的reads数

当完成测序的比对工作之后,我们得到了bam/sam文件。那么,如何得到reads的统计数据呢? 这有很多途径: 1.读取日志文件。对于bowtie的日志,其中会包括如下的描述: 31991083 re...
阅读全文
Evolution

进化树上Bootstrap和Identity区别

Bootstrap,即自展值,是用来检验你所计算的进化树分支可信度的。简单地讲就是把序列的位点都重排,重排后的序列再用相同的办法构树,如果原来树的分枝在重排后构的树中也出现了,就给这个分枝打上一分,如...
阅读全文
Statistics

交叉验证(Cross-validation)

交叉验证是一种用来评价一个统计分析的结果是否可以推广到一个独立的数据集上的技术。主要用于预测,即,想要估计一个预测模型的实际应用中的准确度。它是一种统计学上将数据样本切割成较小子集的实用方法。于是可以...
阅读全文