GATK使用方法详解（实例：对INDEL结果进行校正）

2014/04/14评论7,359

对INDEL结果进行校正，与SNP基本一致，只不过INDEL需要使用的known resource不一样

第一步：

同SNP 多选择一些注释类型，但是不用选择tranche值,tranche值是专门为SNP设定的，即使设定了这个值（2.4版本是可以计算这个的，以后就不计算了），计算出来也都是错的，这个在indel里不需要考虑。

第二步：

java -jar GenomeAnalysisTK.jar
-T VariantRecalibrator
-R hg19.fa
-mode INDEL
--maxGaussians 4
-std 10.0
-percentBad 0.12
-input ChrALL.100.sam.recal.10.vcf
-resource:mills,known=true,training=true,truth=true,prior=12.0 Mills_and_1000G_gold_standard.indels.hg19
-an MQ
-an FS
-an InbreedingCoeff
-recalFile ChrALL.100.sam.recal.10.indel.recal
-tranchesFile ChrALL.100.sam.recal.10.indel.tranche
-rscriptFile ChrALL.100.sam.recal.10.indel.R

第三步：

java -jar GenomeAnalysisTK.jar
-T ApplyRecalibration
-R hg19.fa
-mode INDEL
-input hg19.snp.filter.t97.Q10_13.snp.vcf
-recalFile ChrALL.100.sam.recal.11.indel.recal
-tranchesFile ChrALL.100.sam.recal.11.indel.tranche
-o hg19.snp.filter.t97.Q10_13.both.vcf

最后得到的hg19.snp.filter.t97.Q10_13.both.vcf文件，就是我们最终想得到的过滤好的变异集合。其实到这里就已经完成了变异检测的所有步骤，最后生成的hg19.snp.filter.t97.Q10_13.both.vcf文件就可以用于你的下游分析了。

原文来自：http://blog.sina.com.cn/s/blog_12d5e3d3c0101qu6t.html