我们统一选择p<0.05而且abs(logFC)大于1的基因为显著差异表达基因集,对这个基因集用R包做KEGG/GO超几何分布检验分析。 然后把表达矩阵和分组信息分别作出cls和gct文件,导入...
转录组入门(7):差异表达分析
这个步骤推荐在R里面做,载入表达矩阵,然后设置好分组信息,统一用DEseq2进行差异分析,当然也可以走走edgeR或者limma的voom流程。 基本任务是得到差异分析结果,进阶任务是比较多个差异分析...
转录组入门(6): reads计数
要求 实现这个功能的软件也很多,还是烦请大家先自己搜索几个教程,入门请统一用htseq-count,对每个样本都会输出一个表达量文件。 需要用脚本合并所有的样本为表达矩阵。参考:生信编程直播第四题:多...
转录组入门(5): 序列比对
比对软件很多,首先大家去收集一下,因为我们是带大家入门,请统一用hisat2,并且搞懂它的用法。 直接去hisat2的主页下载index文件即可,然后把fastq格式的reads比对上去得到sam文件...
转录组入门(4):了解参考基因组及基因注释
准备工作 参考基因组 测序得到的是几百bp的短read, 相当于把拼图打散了给你。如果没有参考基因组,从头(de novo)组装等于是重走人类基因组计划的老路,也就是打散了拼图,却不告诉你原来是什么样...
转录组入门(3):质量控制
需要用安装好的sratoolkit把sra文件转换为fastq格式的测序文件,并且用fastqc软件测试测序文件的质量! 数据解压 之前下载了所有的数据,但只有样本915才是mRNA-Seq测序结果,...
转录组入门(2):读文章拿到测序数据
本系列课程学习的文章是:AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commu...
RNA-seq数据综合分析教程
2 RNA-seq数据分析 mRNA-seq是目前最常用的高通量测序技术,一般的用法就是看看基因表达谱,寻找差异表达的基因。我和高通量测序数据分析结缘,也是因为RNA-seq。 一开始我对mRNA-s...
基于RNA-Seq的转录组数据分析入门介绍
基于RNA-Seq的转录组数据分析已经在研究中运用了近10来年了,现在一些杂志在发表论文的时候reviewers已经倾向于用RNA-Seq来替代RT-qPCR。对于生物信息专业“干实验”...
为什么说FPKM/RPKM是错的
去年,我接触了一个RNA-seq的项目,做完之后,我重新思考了FPKM和RPKM的计算,觉得它们很可能是不对的,后来查阅了一些文献终于验证了我的想法。现在我重新将这个过程记录下来: 1. FPKM和R...