规范的命名是基因变异解读中不可或缺的一部分。ACMG变异分类标准建议对变异进行统一的标准化命名以确保定义明确并实现基因组信息的有效共享和下游使用。1998年由人类基因组变异协会(HGVS)、人类变异项...
用snpEFF对vcf格式的突变数据进行注释
这个软件比较重要,尤其是对做遗传变异相关研究的,很多人做完了snp-calling后喜欢用ANNOVAR来进行注释,但是那个注释还是相对比较简单,只能得到该突变位点在基因的哪个区域,那个基因这样的信息...
用VEP对vcf格式的突变数据进行注释
VEP是国际三大数据库之一的ENSEMBL提供的,也是非常主流和方便,但它是基于perl语言的,所以在模块方面可能会有点烦人。跟snpEFF一样,也是对遗传变异信息提供更具体的注释,而不仅仅是基于位点...
人类基因组各种版本对应关系
首先是NCBI对应UCSC,对应ENSEMBL数据库: GRCh36 (hg18): ENSEMBL release_52. GRCh37 (hg19): ENSEMBL release_59/61/...
TCGA/癌症简称/缩写/TCGA癌症中英文对照
TCGA数据库中含有的癌症名称,简写和中文名称 Abbr 英文名称 中文名称 ACC Adrenocortical carcinoma 肾上腺皮质癌 BLCA Bladder Urothelial C...
如何去除二代测序数据中的PCR duplication
最近听闻前公司和另一家公司A因为一个项目中二代测序数据PCR duplication的问题在扯皮。前公司比较两对Paired-end reads的第8~113bp区间内碱基是否完全相同(PE150);...
WES(3)snp-filter
其中freebayes,bcftools,gatk都是把所有的snp细节都call出来了,可以看到下面这些软件的结果有的高达一百多万个snp,而一般文献都说外显子组测序可鉴定约8万个变异! 这样得到突...
WES(2)snp-calling
准备文件:下载必备的软件和参考基因组数据 1、软件 ps:还有samtools,freebayes和varscan软件,我以前下载过,这次就没有再弄了,但是下面会用到 2、参考基因组 3、参考 突变数...
WES(1)测序质量控制
这一步主要看看这些外显子测序数据的测序质量如何: 首先用fastqc处理,会出一些图表,肯定是没问题的啦,如果数据有问题,公司就不会给你,那样不砸了他们自己的招牌嘛。 然后我们粗略统计下平均测序深度及...
DISCOVAR的使用
1. DISCOVAR简介 DISCOVAR 是有 ALLPATHS-LG 软件开发团队做出来的软件。主要用于利用 PE 250bp 数据与参考基因组的比对结果,对基因组进行 Variants cal...