GATK,全称是Genome Anlysis Toolkit,顾名思义,是一套用于分析基因组的工具箱。主要功能是寻找变异位点和基因分型,但是实际上功能超多,导致初学者都不知道从何学习GATK。 最近因...
JBrowse使用说明:参考基因组准备
准备参考序列 注意:这一步必须在后续步骤之前运行。 通常,我们需要准备一个物种的基因组fasta文件,当然RNA和protein都是没有问题。通过prepare-refseqs.pl格式化生成的tra...
JBrowse使用说明:如何配置track分面搜索选择器
JBrowse要展示数据达到一定量级之后,如何方便管理这些track就成了一个问题,JBrowse支持三种track选择器: JBrowse/View/TrackList/Simple:已经作古的选择...
单细胞测序教程
小伙伴们,大家好,今天我们来开启一个新的话题,Single cell sequence,近来单细胞测序在探索生物过程、疾病机理等方面展现了前所未有的精度,通过对单细胞进行 DNA 和 RNAseq 我...
使用新版Falcon进行三代测序基因组组装
这里的新版指的是PacBio公司在2018年9月发布pb-assembly, 而这篇文章是在2018年9月30日发的。 今年早些时候在参加三代培训时,听说PacBio会在今年对Falcon进行一些改变...
提取heatmap聚类后行列名称
在画heatmap的时候,往往由于某种数据分析需要,需要获得聚类后的heatmap的col和row的顺序。这里展示如何从pheatmap的聚类结果中提取我们需要的信息。 这里通过产生随机数据来演示。 ...
Pacbio Sequel两种bam文件解析
pacbio目前有两种主流的测序平台,RSII和Sequel,后者是前者的升级版。 pacbio sequel下机是bam格式的reads文件,它和reads比对到参考基因组上生成的bam文件,内容有...
Speedseq的安装和使用
1. speedseq的安装 1.1 安装前先需安装好python (建议升级到2.7最新版2.7.13),而且需要安装pysam库(需升级到最新版,这里升级到0.11.2版本),如果没有升级,可能在...