目前,随着单细胞RNA测序技术(scRNA)的成熟,新的测序方案不断出现。那么,各种技术平台的性能如何呢?优缺点有哪些呢?如何根据我们的研究目的选择合理的单细胞RNA测序技术呢? 本文系统的比较了6种...
ROC曲线
在分类预测中,我们一般比较关注准确率,但是,混淆矩阵也是非常重要的。尤其是当我们都其中的某一类别特别感兴趣的时候,通常要单独的看这个类别的召回率和精度,比如在癌症诊断过程中,我们宁愿错误的认为一个人是...
数据降维与可视化之t-SNE
t-SNE是目前来说效果最好的数据降维与可视化方法,但是它的缺点也很明显,比如:占内存大,运行时间长。但是,当我们想要对高维数据进行分类,又不清楚这个数据集有没有很好的可分性(即同类之间间隔小,异类之...
t-SNE使用过程中的一些坑
几年前,我写过一个关于t-SNE原理的介绍博客,在日常的工作中,涉及到数据可视化的时候一般都会想到去使用这个工具。但是使用归使用,大部分人却很少去思考为什么要用t-SNE,怎样“正确”的使用t-SNE...
快速入门GATK
GATK,全称是Genome Anlysis Toolkit,顾名思义,是一套用于分析基因组的工具箱。主要功能是寻找变异位点和基因分型,但是实际上功能超多,导致初学者都不知道从何学习GATK。 最近因...
JBrowse使用说明:参考基因组准备
准备参考序列 注意:这一步必须在后续步骤之前运行。 通常,我们需要准备一个物种的基因组fasta文件,当然RNA和protein都是没有问题。通过prepare-refseqs.pl格式化生成的tra...
JBrowse使用说明:如何配置track分面搜索选择器
JBrowse要展示数据达到一定量级之后,如何方便管理这些track就成了一个问题,JBrowse支持三种track选择器: JBrowse/View/TrackList/Simple:已经作古的选择...
单细胞测序教程
小伙伴们,大家好,今天我们来开启一个新的话题,Single cell sequence,近来单细胞测序在探索生物过程、疾病机理等方面展现了前所未有的精度,通过对单细胞进行 DNA 和 RNAseq 我...
使用新版Falcon进行三代测序基因组组装
这里的新版指的是PacBio公司在2018年9月发布pb-assembly, 而这篇文章是在2018年9月30日发的。 今年早些时候在参加三代培训时,听说PacBio会在今年对Falcon进行一些改变...
提取heatmap聚类后行列名称
在画heatmap的时候,往往由于某种数据分析需要,需要获得聚类后的heatmap的col和row的顺序。这里展示如何从pheatmap的聚类结果中提取我们需要的信息。 这里通过产生随机数据来演示。 ...