考虑这样一个问题,“如果要保证基因组上95%的区域其覆盖深度在30x以上的话,那么最低的平均测序深度应该是多少?”。 关于测序量的估计,对于做生物信息的人来讲应算是家常便饭了,多数时候我们都能直接根据...
三代基因组测序技术原理简介
前言:首先,这一篇博文中的内容并非原创,而是对多篇文献中内容的直接摘录,有些图片和资料还来自身边的同事(在此深表谢意!),再夹杂自己的零星想法,写在这里分享与大家,同时也是为了方便自己日后若有需要能够...
表观遗传学信息如何传递
作者:孙学军,原文:http://blog.sciencenet.cn/blog-41174-773566.html Brian Dias去年10月作了父亲,和许多新父母一样,孩子出生前他就开始考虑要...
bcftools使用笔记
什么是vcf?全称是variant call format,是用来记录SNP,INDEL和SV变异信息的文本。在GATK软件中得到最好的支持,当然SAMtools得到的结果也是VCF格式,和GATK的...
GATK使用
首先说说GATK可以做什么。它主要用于从sequencing 数据中进行variant calling,包括SNP、INDEL。比如现在风行的exome sequencing找variant,一般通过...
linux下用Aspera从NCBI上下载SRA格式宏基因组数据
1、首先安装Aspera 参考《使用Aspera从EBI或NCBI下载基因组数据》,保证该软件在服务器上已经可用。 测试代码,注意最后有个点,代表下载到当前目录下: ascp -i /your-p...
基因组数据库-一个物种的官网
基因组数据库相当于一个物种的官网,关心该物种的科学家可以通过访问网站了解物种信息、科研进展、做blast等简单分析、下载基因组数据,基因组数据库最核心的模块是基因组浏览器,可以可视化查看基因结构、变异...
VCF格式
CHROM 染色体编号 POS 位置 ID 基因ID REF 参考基因组碱基 ALT 样本碱基 QUAL 变异可信度,越高越好 QUAL:Phred格式(Phred_scaled)的质量值,表 示在该...
VCF格式解析
VCF是用于描述SNP,INDEL和SV结果的文件,下面所记录的是以GATK软件结果的VCF文件,与SAMtools的结果有点不同 VCF文件可以分为两部分看,最上面#号注释的的部分是对一些参数的解释...
NGS 实验中的错误来自哪里
尽管测序技术在不断发展,但不论是哪种测序平台,测序过程中都不可避免地存在一些错误。《Nature Review Genetics》近日发表了一篇很有意思的综述,谈论了NGS实验中错误的来源,以及如何利...