不同基因座位的各等位基因在人群中以一定的频率出现。在某一群体中,不同座位某两个等位基因出现在同一条染色体上的频率高于预期的随机频率的现象,称连锁不平衡 (linkage disequilibrium)...
高通量测序领域常用名词解释
什么是高通量测序? 高通量测序技术(High-throughput sequencing,HTS)是对传统Sanger测序(称为一代测序技术)革命性的改变, 一次对几十万到几百万条核酸分子进行序列测定...
两列样本的差异基因筛选
两列样本数据的差异基因筛选方法:FoldChange法+FDR控制 其中,FDR值的计算方法如下: 1)对每个基因进行p-value的计算 假设观测到基因A对应的reads数为x,已知在一个大文库中,...
外显子组测序
外显子(exon)是真核生物基因的一部分,包含着合成蛋白质所需要的信息。全部外显子,称为“外显子组”(Exome)。外显子组测序(Exome sequencing)是指利用序列捕获技术将全基因组外显子...
何为假设性检验?
准备再尝试一下,用大白话叙述一遍统计推断中最基础的东西(假设检验、P值、……),算是把这段时间的阅读和思考做个梳理(东西不难,思考侧重在如何表述和展示)。这次打算用一种“迂回的”表达方式,比如,本文从...
P-value:一个注脚
在上一篇文章里面简要介绍了p值的由来、计算和意义,这篇文章刚再次谈谈p-value。 P值就是当原假设为真时,比所得到的样本观察结果更极端的结果出现的概率。 The P-value is the pr...
说说大家经常见到的p值
在论坛,经常发现有人发关于P值的帖子,搜索了一下,一共有29个关于P值的帖子。的确,P值是最常用的一个统计学指标,几乎统计软件输出结果都有P值。了解P值的由来、计算和意义很有必要。 一、P值的由来 R...
箱线图(boxplot)介绍
箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法。它也可以粗略地看出数据是否具有...
SAM格式
SAM是一种序列比对格式标准, 由sanger制定,是以TAB为分割符的文本格式。主要应用于测序序列mapping到基因组上的结果表示,当然也可以表示任意的多重比对结果。 不同的软件,不同的时期,不同...
内含子有什么用?
作者:牛登科 三十年前问这个问题?你得到的答复是内含子没什么用,属于垃圾DNA或者说分子水平的寄生虫。 但是后来,一个又一个基因的可变剪接现象被发现。尤其是人类基因组测序完成后,人类基因组中没有发现原...