GATK使用方法详解

一、使用GATK前须知事项:

(1)对GATK的测试主要使用的是人类全基因组和外显子组的测序数据,而且全部是基于illumina数据格式,目前还没有提供其他格式文件(如Ion Torrent)或者实验设计(RNA-Seq)的分析方法。

(2)GATK是一个应用于前沿科学研究的软件,不断在更新和修正,因此,在使用GATK进行变异检测时,最好是下载最新的版本,目前的版本是2.8.1(2014-02-25)。下载网站:http://www.broadinstitute.org/gatk/download

(3)在GATK使用过程中(见下面图),有些步骤需要用到已知变异信息,对于这些已知变异,GATK只提供了人类的已知变异信息,可以在GATK的FTP站点下载(GATK resource bundle)。如果要研究的不是人类基因组,需要自行构建已知变异,GATK提供了详细的构建方法。

(4)GATK在进行BQSR和VQSR的过程中会使用到R软件绘制一些图,因此,在运行GATK之前最好先检查一下是否正确安装了R和所需要的包,所需要的包大概包括ggplot2、gplots、bitops、caTools、colorspace、gdata、gsalib、reshape、RColorBrewer等。如果画图时出现错误,会提示需要安装的包的名称。

 

二、GATK的使用流程

GATK最佳使用方案:共3大步骤,即:

原始数据的处理 --> 变异检测  --> 初步分析 (点击链接查看具体步骤分析方法中文教程)

该套GATK分析方法使用教程转载自葡萄糖博客(http://blog.sina.com.cn/u/5056118076)

原文来自:http://blog.sina.com.cn/s/blog_12d5e3d3c0101qu6e.html

    • zhspgood 1

      有没有GATK原理性的文档。不是flow

    发表评论

    匿名网友

    拖动滑块以完成验证