什么是批次效应? 大型的单细胞测序项目一般都会产生许多细胞,这些样本制备过程很难保持时间一致、试剂一致,另外上机测序的时候也不一定在同一个测序仪上 具体可以看这篇文章:https://www.natu...
单细胞转录组数据校正批次效应实战(中)
第二个数据--CEL-seq2, GSE85241 Muraro et al. (2016) 利用CEL-seq2技术并结合UMI、ERCC得到的 https://www.ncbi.nlm.nih.g...
单细胞转录组数据校正批次效应实战(下)
三组不同数据的混合 我们可以从每个数据集(也就是每个批次)中挑选前1000个生物学差异最大的基因 还记得之前是如何得到每个数据集的HVGs吗?主要利用trendVar、decomposeVar,另外存...
使用ComplexHeatmap包绘制热图
加载所需R包 library(ComplexHeatmap) require(circlize) # 设置工作路径 setwd("/Users/Davey/Desktop/") # 清除当前环境中的变...
ComplexHeatmap绘制全基因组突变景观图
ComplexHeatmap R包是Zuguang Gu编写的,也是现在文章中利用的较多的R包。这个包能实现的功能很强大,今天给大家介绍一下利用ComplexHeatmap R包中的oncoprint...
科普决策树(Decision Tree):通俗易懂
决策树是一种机器学习的方法。决策树的生成算法有ID3, C4.5和C5.0等。决策树是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果...
使用NextDenovo组装Nanopore数据
NextDenovo是武汉未来组胡江博士团队开发的一个三代组装工具,能够用于PacBio和Nanopore数据的组装。但是从官方的介绍而言,此工具在组装Nanopore上优势更大一些。 NextDen...
多元分类(Multi-label classification)性能评价之宏平均(macro-average)与微平均(micro-average)
通常,我们在评价classifier的性能时使用的是accuracy,考虑在多类分类的背景下 accuracy = (分类正确的样本个数) / (分类的所有样本个数) 这样做其实看上去也挺不错的,不过...
三维基因组技术(五):TAD 分析流程
写在前面 以下内容均来自我在菲沙基因(Frasergen)暑期生信培训班上记录的课堂笔记 1.TAD 2.TAD分析流程 2.1 Cworld-dekker软件的安装 git clone https:...
三维基因组技术(四):Compartment 分析流程
写在前面 以下内容均来自我在菲沙基因(Frasergen)暑期生信培训班上记录的课堂笔记 1.Compartment计算 2.Compartment 分析流程 2.1 Cworld-dekker软件的...