对INDEL结果进行校正,与SNP基本一致,只不过INDEL需要使用的known resource不一样
第一步:
同SNP 多选择一些注释类型,但是不用选择tranche值,tranche值是专门为SNP设定的,即使设定了这个值(2.4版本是可以计算这个的,以后就不计算了),计算出来也都是错的,这个在indel里不需要考虑。
第二步:
java -jar GenomeAnalysisTK.jar
-T VariantRecalibrator
-R hg19.fa
-mode INDEL
--maxGaussians 4
-std 10.0
-percentBad 0.12
-input ChrALL.100.sam.recal.10.vcf
-resource:mills,known=true,training=true,truth=true,prior=12.0 Mills_and_1000G_gold_standard.indels.hg19
-an MQ
-an FS
-an InbreedingCoeff
-recalFile ChrALL.100.sam.recal.10.indel.recal
-tranchesFile ChrALL.100.sam.recal.10.indel.tranche
-rscriptFile ChrALL.100.sam.recal.10.indel.R
第三步:
java -jar GenomeAnalysisTK.jar
-T ApplyRecalibration
-R hg19.fa
-mode INDEL
-input hg19.snp.filter.t97.Q10_13.snp.vcf
-recalFile ChrALL.100.sam.recal.11.indel.recal
-tranchesFile ChrALL.100.sam.recal.11.indel.tranche
-o hg19.snp.filter.t97.Q10_13.both.vcf
最后得到的hg19.snp.filter.t97.Q10_13.both.vcf文件,就是我们最终想得到的过滤好的变异集合。其实到这里就已经完成了变异检测的所有步骤,最后生成的hg19.snp.filter.t97.Q10_13.both.vcf文件就可以用于你的下游分析了。
原文来自:http://blog.sina.com.cn/s/blog_12d5e3d3c0101qu6t.html