最近大量跑chip-seq,看到一篇2016Cell的文章《Cistrome and Epicistrome Features Shape the Regulatory DNA Landscape》感...
矫正批次效应
批次效应(batch effect)简单说来就是因为实验做了几个批次导致的实验误差,比如芯片数据,每次都要用机器读取,那么光照时间和强度每次都可能不一样, 极有可能出现批次效应。 再比如,实验的三个重...
单细胞RNA测序方案比较
目前,随着单细胞RNA测序技术(scRNA)的成熟,新的测序方案不断出现。那么,各种技术平台的性能如何呢?优缺点有哪些呢?如何根据我们的研究目的选择合理的单细胞RNA测序技术呢? 本文系统的比较了6种...
ROC曲线
在分类预测中,我们一般比较关注准确率,但是,混淆矩阵也是非常重要的。尤其是当我们都其中的某一类别特别感兴趣的时候,通常要单独的看这个类别的召回率和精度,比如在癌症诊断过程中,我们宁愿错误的认为一个人是...
数据降维与可视化之t-SNE
t-SNE是目前来说效果最好的数据降维与可视化方法,但是它的缺点也很明显,比如:占内存大,运行时间长。但是,当我们想要对高维数据进行分类,又不清楚这个数据集有没有很好的可分性(即同类之间间隔小,异类之...
t-SNE使用过程中的一些坑
几年前,我写过一个关于t-SNE原理的介绍博客,在日常的工作中,涉及到数据可视化的时候一般都会想到去使用这个工具。但是使用归使用,大部分人却很少去思考为什么要用t-SNE,怎样“正确”的使用t-SNE...
快速入门GATK
GATK,全称是Genome Anlysis Toolkit,顾名思义,是一套用于分析基因组的工具箱。主要功能是寻找变异位点和基因分型,但是实际上功能超多,导致初学者都不知道从何学习GATK。 最近因...
JBrowse使用说明:参考基因组准备
准备参考序列 注意:这一步必须在后续步骤之前运行。 通常,我们需要准备一个物种的基因组fasta文件,当然RNA和protein都是没有问题。通过prepare-refseqs.pl格式化生成的tra...
JBrowse使用说明:如何配置track分面搜索选择器
JBrowse要展示数据达到一定量级之后,如何方便管理这些track就成了一个问题,JBrowse支持三种track选择器: JBrowse/View/TrackList/Simple:已经作古的选择...
单细胞测序教程
小伙伴们,大家好,今天我们来开启一个新的话题,Single cell sequence,近来单细胞测序在探索生物过程、疾病机理等方面展现了前所未有的精度,通过对单细胞进行 DNA 和 RNAseq 我...