Tophat+cufflinks组合是RNA-Seq数据分析的一个很经典的分析方法了,四年前关于这两个软件的使用,Nature Protocol专门发文介绍如何使用这两个软件,具体可以参考《利用top...
[深度学习笔记1]Logistic回归:最基础的神经网络
个人认为理解并掌握这个logistic regression是学习神经网络和深度学习最重要的部分,也是最基础的部分,学完这个再去看浅层神经网络、深层神经网络,会发现后者就是logistic重复了若干次...
利用R语言heatmap.2函数进行聚类并画热图
数据聚类然后展示聚类热图是生物信息中组学数据分析的常用方法,在R语言中有很多函数可以实现,譬如heatmap,kmeans等,除此外还有一个用得比较多的就是heatmap.2。最近在网上看到一个笔记文...
担心数据质量不可靠?千年基因推出外显子组测序数据质量评估服务
越来越多的研究表明,数据质量对于外显子组测序至关重要。当数据质量较低时,研究人员很可能会错过有用的变异信息。例如,埃默里大学医学院教授Madhuri Hegde在对一名视网膜营养不良患者进行外显子组测...
从头开始实现Transformer
GPT-3,BERT,XLNet这些都是当前自然语言处理(NLP)的新技术,它们都使用一种称为 transformer 的特殊架构组件,这是因为,transformer 这种新机制非常强大,完整的tr...
肿瘤组学数据分析培训班
肿瘤研究已经进入组学大数据时代,多组学技术已经广泛应用于癌症研究,尤其是用于剖析肿瘤不同生物学特点以发现生物标记物、增进对发病机制的认识、发现治疗方法等方面。但是大数据分析需要的专业统计学知识和计算机...
有效统计实践的十项简明原则
本文作者:Robert E. Kass; Brian S. Caffo; Marie Davidian; Xiao-Li Meng; Bin Yu; Nancy Reid 原文出处 Ten Simpl...
利用ggpubr包进行R语言可视化
Hadley Wickham创建的可视化包ggplot2可以流畅地进行优美的可视化,但是如果要通过ggplot2定制一套图形,尤其是适用于杂志期刊等出版物的图形,对于那些没有深入了解ggplot2的人...
Transformer及其变种
简介 近年来NLP领域最让人印象深刻的成果,无疑是以谷歌提出的Bert为代表的预训练模型了。它们不断地刷新记录(无论是任务指标上,还是算力需求上),在很多任务上已经能超越人类平均水平,还具有非常良好的...
EvolView画进化树+热图:组合图的绘制
上一篇《进化树+条形图:“组合图”的绘制》介绍了如何通过改变标尺来改变进化树分支长度和进化树的注释,相信大家对进化树与其他类型图表的组合有了一定的了解,局限于微信公众号的篇幅,其实还有好多东西没有讲到...