GATK使用方法详解(实例:对INDEL结果进行校正)

评论7,193

对INDEL结果进行校正,与SNP基本一致,只不过INDEL需要使用的known resource不一样

第一步:

同SNP 多选择一些注释类型,但是不用选择tranche值,tranche值是专门为SNP设定的,即使设定了这个值(2.4版本是可以计算这个的,以后就不计算了),计算出来也都是错的,这个在indel里不需要考虑。

第二步:

java -jar GenomeAnalysisTK.jar

-T VariantRecalibrator

-R hg19.fa

-mode INDEL

--maxGaussians 4

-std 10.0

-percentBad 0.12

-input ChrALL.100.sam.recal.10.vcf

-resource:mills,known=true,training=true,truth=true,prior=12.0 Mills_and_1000G_gold_standard.indels.hg19

-an MQ

-an FS

-an InbreedingCoeff

-recalFile ChrALL.100.sam.recal.10.indel.recal

-tranchesFile ChrALL.100.sam.recal.10.indel.tranche

-rscriptFile ChrALL.100.sam.recal.10.indel.R

第三步:

java -jar GenomeAnalysisTK.jar

-T ApplyRecalibration

-R hg19.fa

-mode INDEL

-input hg19.snp.filter.t97.Q10_13.snp.vcf

-recalFile ChrALL.100.sam.recal.11.indel.recal

-tranchesFile ChrALL.100.sam.recal.11.indel.tranche

-o hg19.snp.filter.t97.Q10_13.both.vcf

最后得到的hg19.snp.filter.t97.Q10_13.both.vcf文件,就是我们最终想得到的过滤好的变异集合。其实到这里就已经完成了变异检测的所有步骤,最后生成的hg19.snp.filter.t97.Q10_13.both.vcf文件就可以用于你的下游分析了。

原文来自:http://blog.sina.com.cn/s/blog_12d5e3d3c0101qu6t.html

发表评论

匿名网友