R语言在处理和分析数据上有其独有的优势,但也有一些让人一言难尽的智障操作,比如下面想讲的R语言中表格(矩阵)行名重复的处理。事情的起因是这样的,我最近在帮另一个研究组处理一些RNA-seq的数据,他们...
深入卷积神经网络背后的数学原理
【导读】在计算机神经视觉技术的发展过程中,卷积神经网络成为了其中的重要组成部分,本文对卷积神经网络的数学原理进行了介绍。 文章包括四个主要内容:卷积、卷积层、池化层以及卷积神经网络中的反向传播原理。在...
FPKM/RPKM之外的那些标准化方法
目录 1. 标准化 1.1. House-keeping gene(s) 1.2. spike-in 1.3. CPM 1.4. TCS 1.5. Quantile 1.6. Median of Ra...
使用SignalP对蛋白序列进行信号肽预测
1. 信号肽简介 信号肽是蛋白质N-末端一段编码长度为5-30的疏水性氨基酸序列,用于引导新合成蛋白质向通路转移的短肽链。信号肽存在于分泌蛋白、跨膜蛋白和真核生物细胞器内的蛋白中。 信号肽指引蛋白质转...
SPSS中图表模板的使用及Excel中替换图表数据
我们常通过SPSS绘图,比如下面的直方图。对于图,一般需要修改横纵坐标轴、坐标轴的标题、图表布局等。这个简单,咱们在SPSS中双击该图,出现了图表编辑器,然后根据要求修改即可。 至于具体修改,全靠...
VCF格式详解
VCF格式:Vriant Call Format.关于其详细描述,请见GATK的FAQ:How should I interpret VCF files produced by the GATK? 1...
超几何分布和fisher精确检验
Fisher精确检验(fisher’s exat test)是进行统计分析时经常碰到的一种检验方法,它基于超几何分布,作用于离散变量,用于检测两种分类方法的结果是否独立。 首先,我们介绍超几何分布。超...
Control-FREEC的使用
Control-FREEC是一款广受好评的WGS、WES数据CNV检测软件。 安装 当前最新版本是v11.6(29 May 2020)。 下载源码编译安装 wget https://github.co...
VAF,MAF,肿瘤纯度,MCF,CCF的概念和计算方法
VAF的概念和计算方法 VAF的全称是Variant Allele Frequency(变异等位基因频率)或Variant Allele Fraction(变异等位基因分数)。简单来说就是在基因组某个...
多指标ROC曲线怎么画?
最近,有多位临床研究者来咨询,都问到同样的一个问题,说在临床上某一个指标诊断某种疾病的准确性往往不高,于是研究者想将多个指标综合,看多指标综合对某一疾病诊断的准确性如何。 大家都知道,ROC曲线可以实...