FASTQ文件格式和命名 高通量测序之后用于下游分析的数据一般存储在FASTQ文件中。为了节省空间,又不影响下游使用,也一般用gzip压缩的格式。 单端测序每个文库只返回一个FASTQ文件,双端测序两...
数据可视化完美指南-R-python
从数据到图表 有什么样的数据做什么样的图 作者提供了一张树状图,帮助并引导我们找到合适自己数据的的可视化方式 What kind of data do you have? Pick the main ...
基因突变的命名规则和表示方法
人类基因组变异协会(HGVS:Human Genome Variation Society)规则是目前学术界所公认的突变命名规则。 置换(>):一个核苷酸被另一个核苷酸替代,使用“>”来表...
计算OR值(odds ratio、比值比、优势比)
Odds ratio(OR)从字面上可看出,是两个odds的ratio,其用于: 在病例对照研究(case-control study)中,分析暴露风险因素与疾病(或者用药)的关联程度;主要是反映暴露...
如何检测超低频突变?
肿瘤是高度异质性的,其中致病突变可能以极低比例存在,比如allel frequency< 0.1%~0.01%,甚至更低。而目前最准的Hiseq测序本身的单个碱基的错误率就在0.2%左右,再加上...
GATK使用方法详解
一、使用GATK前须知事项: (1)对GATK的测试主要使用的是人类全基因组和外显子组的测序数据,而且全部是基于illumina数据格式,目前还没有提供其他格式文件(如Ion Torrent)或者实验...
Real Time PCR 检测方法原理
嵌合荧光染料检测法 (SYBR Green I) SYBR Green I是荧光定量PCR最常用的DNA结合染料,能与双链DNA非特异性结合,结合后发出荧光,可以通过检测反应体系中的SYBR Gree...
基因投错票,导致肿瘤
说起肿瘤,大家都知道肿瘤是一种致命的疾病,是失控的细胞异常增生。同时大家又对肿瘤有许多的神秘感。 今天,我就用一种新的视角来试着解释一下“肿瘤的发生的原因”。希望能给大家揭开“肿瘤发生机制”头上神秘面...
chromVAR: 从单细胞表观数据中推断转录因子相关开放区域
chromVAR是一个用于分析稀疏染色质开放的R包。chromVAR的输入文件包括,ATAC-seq处理后的fragments文件(过滤重复和低质量数据), DNAse-seq实验结果,以及基因组注释...
预后研究与预测模型
临床研究中,对于疾病的预后研究的应用非常普遍,最负盛名如Framingham研究,开发了一系列的预测模型。本章我们就什么是医学预测模型、如何开发预测模型、如何做模型的验证,如何应用等问题做一些概要介绍...