GATK,全称是Genome Anlysis Toolkit,顾名思义,是一套用于分析基因组的工具箱。主要功能是寻找变异位点和基因分型,但是实际上功能超多,导致初学者都不知道从何学习GATK。 最近因...
GATK使用方法详解(变异检测)
1. Variant Calling GATK在这一步里面提供了两个工具进行变异检测——UnifiedGenotyper和HaplotypeCaller。其中HaplotypeCaller一直还在开发...
GATK使用方法详解(初步分析)
这一步主要是对上面所得到的最终vcf中的结果进行一些初步的分析,比如计算这些变异位点在dbsnp中的比例、Ti/Tv的比例、每个样本中的snp数量……。此外,还可以对变异位点的同义/非同义突变进行统计...
GATK使用方法详解(相关参数和参考文件说明)
VariantRecalibrator参数详解 VariantRecalibrator -badLodCutoff 当LOD得分低于这个值的时候,就用于构建高斯混合模型的bad variants。默认...
GATK使用方法详解(实例:对INDEL结果进行校正)
对INDEL结果进行校正,与SNP基本一致,只不过INDEL需要使用的known resource不一样 第一步: 同SNP 多选择一些注释类型,但是不用选择tranche值,tranche值是专门为...
GATK使用方法详解(实例:对SNP结果进行校正)
第一步: java -jar GenomeAnalysisTK.jar -R hg19.fa --maxGaussians 4 -numBad 10000 (这个参数在最新的GATK版本里面已经没有了...
GATK使用方法详解(原始数据的处理)
1. 对原始下机fastq文件进行过滤和比对(mapping) 对于Illumina下机数据推荐使用bwa进行mapping。 Bwa比对步骤大致如下: (1)对参考基因组构建索引: 例子:bwa i...
GATK使用
首先说说GATK可以做什么。它主要用于从sequencing 数据中进行variant calling,包括SNP、INDEL。比如现在风行的exome sequencing找variant,一般通过...