刚看了这个算法,理解如下,放在这里,备忘,如有错误的地方,请指出,谢谢 需要做聚类的数组我们称之为【源数组】 需要一个分组个数K变量来标记需要分多少个组,这个数组我们称之为【聚类中心数组】及 一个缓存...
相似度计算之曼哈顿距离
曼哈顿距离是由十九世纪的赫尔曼·闵可夫斯基所创词汇 ,是种使用在几何度量空间的几何学用语,用以标明两个点在标准坐标系上的绝对轴距总和。 上图中红线代表曼哈顿距离,绿色代表欧氏距离,也就是直线距离,而蓝...
fasterq-dump使用介绍
之前写过一篇文章Fastq-dump使用, 详细介绍了fastq-dump的用法。 虽然fastq-dump参数很多,而且一直被吐槽参数说明写的太差,但是如果真的要用起来其实也就是一行代码 fastq...
Fastq-dump使用
做生信的基本上都跟NCBI-SRA打过交道,尤其是fastq-dump大家肯定不陌生.NCBI的fastq-dump软件一直被大家归为目前网上文档做的最差的软件之一",而我用默认参数到现在基本也没有出...
单细胞测序中如何对低质量细胞进行质控检验
1 低质量细胞的影响 细胞破坏后,可能会导致线粒体或核RNAs占比升高(就是上面解释的大量细胞质中mRNA流失,而线粒体或核RNAs含量基本不变),很有可能会根据这个结果形成自己的一个个cluster...
single cell单细胞测序分析教程
1 前言 依旧是我的传统:不🙅♀️翻译 并结合自己的知识尝试加入自己的理解 这次的官方教程主要介绍使用简单数据集(Lun et al. 2017)来走scRNA的分析流程。这个数据集中包含2个96孔...
单细胞转录组数据校正批次效应实战(上)
什么是批次效应? 大型的单细胞测序项目一般都会产生许多细胞,这些样本制备过程很难保持时间一致、试剂一致,另外上机测序的时候也不一定在同一个测序仪上 具体可以看这篇文章:https://www.natu...
单细胞转录组数据校正批次效应实战(中)
第二个数据--CEL-seq2, GSE85241 Muraro et al. (2016) 利用CEL-seq2技术并结合UMI、ERCC得到的 https://www.ncbi.nlm.nih.g...
单细胞转录组数据校正批次效应实战(下)
三组不同数据的混合 我们可以从每个数据集(也就是每个批次)中挑选前1000个生物学差异最大的基因 还记得之前是如何得到每个数据集的HVGs吗?主要利用trendVar、decomposeVar,另外存...
使用ComplexHeatmap包绘制热图
加载所需R包 library(ComplexHeatmap) require(circlize) # 设置工作路径 setwd("/Users/Davey/Desktop/") # 清除当前环境中的变...