Binning分析指把宏基因组中不同个体微生物序列分开,使得同一类序列聚集在一起的过程,其中常见的是同种菌株的序列聚类在一起。进行binning分析可以宏基因组数据中复杂的功能信息定位到菌株水平,方便...
使用cnvkit来对大批量wes样本找cnv
cnvkit被设计来处理同一个批次的多个肿瘤配对样本测序情况,首先对所有的normal数据进行bin处理拿到背景值,然后就这个背景值来处理所有的tumor测序数据计算拷贝数变异情况。 该软件使用比较复...
使用NextDenovo组装Nanopore数据
NextDenovo是武汉未来组胡江博士团队开发的一个三代组装工具,能够用于PacBio和Nanopore数据的组装。但是从官方的介绍而言,此工具在组装Nanopore上优势更大一些。 NextDen...
三维基因组技术(五):TAD 分析流程
写在前面 以下内容均来自我在菲沙基因(Frasergen)暑期生信培训班上记录的课堂笔记 1.TAD 2.TAD分析流程 2.1 Cworld-dekker软件的安装 git clone https:...
三维基因组技术(四):Compartment 分析流程
写在前面 以下内容均来自我在菲沙基因(Frasergen)暑期生信培训班上记录的课堂笔记 1.Compartment计算 2.Compartment 分析流程 2.1 Cworld-dekker软件的...
三维基因组技术(三):Hi-C 数据比对及HiC-Pro的使用
1.Hi-C原理简介 1.1 Hi-C技术高通量染色体构象捕获技术(High-throughput chromosome conformation capture)研究全基因组三维构象及分析染色质片段...
三维基因组技术(二):Hi-C辅助组装与Lachesis的使用
写在前面 以下内容均来自我在菲沙基因(Frasergen)暑期生信培训班上记录的课堂笔记 1.Hi-C 辅助组装(PGA)技术原理 染色质在细胞核内分布的并不是随机分布的,而是不同染色体占据不同的空间...
三维基因组技术(一):简单介绍
写在前面 以下内容均来自我在菲沙基因(Frasergen)暑期生信培训班上记录的课堂笔记 1.基因组空间三维结构与功能 染色质空间三维结构 染色体结构 DNA以一长串复杂的线圈形式堆积成染色体。DNA...
Hi-C文库相关性分析
Hi-C分析需要的测序量比较高,1个样本往往需要测序很多的数据量,1个Hi-C文库可测序的数据量有限(一般情况下100-300G PE150,超出这个量,多测的数据可能含有较高的PCR dup),所以...
RegulomeDB和HaploReg数据库的数据整合
1.背景 GWAS研究产生了大量的SNP,大部分在非编码基因组 这些SNP其实是Lead/Tag SNP,所以需要同时关注与这些SNP处于高LD(linkage disequilibrium)的其它S...