这里的新版指的是PacBio公司在2018年9月发布pb-assembly, 而这篇文章是在2018年9月30日发的。 今年早些时候在参加三代培训时,听说PacBio会在今年对Falcon进行一些改变...
提取heatmap聚类后行列名称
在画heatmap的时候,往往由于某种数据分析需要,需要获得聚类后的heatmap的col和row的顺序。这里展示如何从pheatmap的聚类结果中提取我们需要的信息。 这里通过产生随机数据来演示。 ...
Pacbio Sequel两种bam文件解析
pacbio目前有两种主流的测序平台,RSII和Sequel,后者是前者的升级版。 pacbio sequel下机是bam格式的reads文件,它和reads比对到参考基因组上生成的bam文件,内容有...
Speedseq的安装和使用
1. speedseq的安装 1.1 安装前先需安装好python (建议升级到2.7最新版2.7.13),而且需要安装pysam库(需升级到最新版,这里升级到0.11.2版本),如果没有升级,可能在...
卷积神经网络(CNN)学习笔记:基础入门
概述 卷积神经网络(Convolutional Neural Network, CNN)是深度学习技术中极具代表的网络结构之一,在图像处理领域取得了很大的成功,在国际标准的ImageNet数据集上,许...
Average Nucleotide Identity (ANI) 计算
ANI概念 Average Nucleotide Identity (ANI) 是在核酸水平,两两基因组之间所有直系同源蛋白编码基因的相似性,常用于研究基因组之间的进化距离。相较于传统的 DNA-DN...
宏基因组SOAPdenovo组装
SOAPdenovo特点 宏基因组denovo组装软件中SOAPdenovo(http://soap.genomics.org.cn/soapdenovo)的使用较为广泛,其具有组装速度快,N50值较...
宏基因组binning-CONCOCT
Binning分析指把宏基因组中不同个体微生物序列分开,使得同一类序列聚集在一起的过程,其中常见的是同种菌株的序列聚类在一起。进行binning分析可以宏基因组数据中复杂的功能信息定位到菌株水平,方便...
根据Barcode序列拆分fastq文件
扩增子测序不同于其他高通量测序项目,扩增子测序往往样品量较大,但单个样品的数据量要求不高(因为仅仅研究扩增区域的序列)。为了节约成本,研究者们通常会把多个样品混在一个文库,并给不同样品加上一段 Bar...
PCA主成分分析原理及分析实践详细介绍
主成分分析简介 主成分分析 (PCA, principal component analysis)是一种数学降维方法, 利用正交变换 (orthogonal transformation)把一系列可能...