转录组分析差异表达基因时,结果中会出现Log2FC和FDR值,这两个是什么意思呢?
log2FC中的FC即 fold change,表示两样品(组)间表达量的比值,对其取以2为底的对数之后即为log2FC。一般默认取log2FC绝对值大于1为差异基因的筛选标准;
FDR即False Discovery Rate,错误发现率,是通过对差异显著性p值(p-value)进行校正得到的。由于转录组测序的差异表达分析是对大量的基因表达值进行独立的统计假设检验,会存在假阳性问题,因此在进行差异表达分析过程中,采用了公认的Benjamini-Hochberg校正方法对原有假设检验得到的显著性p值(p-value)进行校正,并最终采用FDR作为差异表达基因筛选的关键指标。一般取FDR<0.01或者0.05作为默认标准。
这两个指标的选取一般是按照经验值去筛选的,并非完全不可以调整。在实验差异基因数目过低或者过高,可以对指标进行微调。
实际上经常看到的差异表达火山图(如下图)里的几条虚线就是这两个指标的体现。