GATK 是 Genome Analysis ToolKit 的缩写,是一款从高通量测序数据中分析变异信息的软件,是目前最主流的snp calling 软件之一。GATK 设计之初是用于分析人类的全外...
GATK中如何计算Inbreeding coefficient(近交系数)
关于近交系数是什么的定义,除了英文资料,中文上也给出了清晰的定义,这里引用一下: 近交系数(inbreeding coefficient)是指根据近亲交配的世代数,将基因的纯化程度用百分数来表示即为近...
GATK4.0和全基因组数据分析实践(上)
前言 在前面的一系列WGS文章中,我讲述了很多基因数据分析的来龙去脉,虽然许多同学觉得很有帮助,但是却缺了一个重要的环节——没有提供实际可用的数据来实战完成具体的流程,不能得到直观的体会。许多读者也纷...
快速入门GATK
GATK,全称是Genome Anlysis Toolkit,顾名思义,是一套用于分析基因组的工具箱。主要功能是寻找变异位点和基因分型,但是实际上功能超多,导致初学者都不知道从何学习GATK。 最近因...
没有root管理员权限安装常用群体遗传学分析软件
由于生物信息的大部分工作都是在没有 root 权限的集群上进行的,本期主要介绍一下非 root 用户怎么安装群体遗传常用的软件。工欲善其事,必先利其器! 准备工作 1、首先我们建一个文件夹,用来存储我...
GATK使用方法详解(变异检测)
1. Variant Calling GATK在这一步里面提供了两个工具进行变异检测——UnifiedGenotyper和HaplotypeCaller。其中HaplotypeCaller一直还在开发...
GATK使用方法详解(初步分析)
这一步主要是对上面所得到的最终vcf中的结果进行一些初步的分析,比如计算这些变异位点在dbsnp中的比例、Ti/Tv的比例、每个样本中的snp数量……。此外,还可以对变异位点的同义/非同义突变进行统计...
GATK使用方法详解(相关参数和参考文件说明)
VariantRecalibrator参数详解 VariantRecalibrator -badLodCutoff 当LOD得分低于这个值的时候,就用于构建高斯混合模型的bad variants。默认...
GATK使用方法详解(实例:对INDEL结果进行校正)
对INDEL结果进行校正,与SNP基本一致,只不过INDEL需要使用的known resource不一样 第一步: 同SNP 多选择一些注释类型,但是不用选择tranche值,tranche值是专门为...
GATK使用方法详解(实例:对SNP结果进行校正)
第一步: java -jar GenomeAnalysisTK.jar -R hg19.fa --maxGaussians 4 -numBad 10000 (这个参数在最新的GATK版本里面已经没有了...