利用cell ranger分析scRNA-Seq数据后一般会得到这三个文件, barcodes.tsv.gz # 每个barcode代表一个cell features.tsv.gz # 每个feat...
DESeq2差异基因分析和批次效应移除
基因表达标准化 不同样品的测序量会有差异,最简单的标准化方式是计算 counts per million (CPM),即原始reads count除以总reads数乘以1,000,000。 这种计算方...
差异表达分析之FDR
本文来自百迈客基因微信公众号(BMK_product) 随着测序成本的不断降低,转录组测序分析已逐渐成为一种很常用的分析手段。但对于转录组分析当中的一些概念,很多人还不是很清楚。今天,小编就来谈谈在转...
基因注释工具-Metascape使用教程
各种各样的高通量测序和分析平台的运用,使得在一次实验中就能产生数以百计的候选基因,这个时候就需要对其进行注释和筛选。这个过程需要了解每个基因的功能描述和生物学过程以及明确它们是否是G蛋白偶联受体,是否...
如何按照热图中的顺序输出表达量文件
大家在用热图软件,例如,pheatmap绘制热图的之后,经常要面临一个问题就是: 图是画出来了,但如果想从图对应到基因,并查询对应基因的表达量就非常麻烦。因为热图聚类功能会打乱样本和基因的顺序,原来的...
转录组入门(8):富集分析
我们统一选择p<0.05而且abs(logFC)大于1的基因为显著差异表达基因集,对这个基因集用R包做KEGG/GO超几何分布检验分析。 然后把表达矩阵和分组信息分别作出cls和gct文件,导入...
转录组入门(7):差异表达分析
这个步骤推荐在R里面做,载入表达矩阵,然后设置好分组信息,统一用DEseq2进行差异分析,当然也可以走走edgeR或者limma的voom流程。 基本任务是得到差异分析结果,进阶任务是比较多个差异分析...
转录组入门(6): reads计数
要求 实现这个功能的软件也很多,还是烦请大家先自己搜索几个教程,入门请统一用htseq-count,对每个样本都会输出一个表达量文件。 需要用脚本合并所有的样本为表达矩阵。参考:生信编程直播第四题:多...
转录组入门(5): 序列比对
比对软件很多,首先大家去收集一下,因为我们是带大家入门,请统一用hisat2,并且搞懂它的用法。 直接去hisat2的主页下载index文件即可,然后把fastq格式的reads比对上去得到sam文件...
转录组入门(4):了解参考基因组及基因注释
准备工作 参考基因组 测序得到的是几百bp的短read, 相当于把拼图打散了给你。如果没有参考基因组,从头(de novo)组装等于是重走人类基因组计划的老路,也就是打散了拼图,却不告诉你原来是什么样...