散点图矩阵是散点图的高维扩展,它从一定程度上克服了在平面上展示高维数据的困难,在展示多维数据的两两关系时有着不可替代的作用。R 软件就包含了各种不同版本的散点图函数,本文主要介绍散点图矩阵的设计及其在...
利用ggplot2显示二维统计量
ggplot2包可称得上是R语言中最为复杂和炫目的绘图包了。PLoB中也有一篇文章《ggplot2绘图入门》对该包进行了介绍。在今年,其版本从0.89升级到了0.90,升级后的新版本提供了许多新的功能...
利用ggplot将多个图形组合在一起
关于ggplot2作图的问题,不少人关心如何将多个图形组合在一起,下面给大家分享一个网上的例子,下图就是最后的结果。画这个图有几个障碍,一个是二维散点的置信椭圆,另一个是一维直方图的边缘显示。解决的方...
R语言编程入门
I. 导论 简单来讲,编程是借助计算机来解决某个问题。学习编程的就是训练我们解决问题的能力。有这样一种说法:在未来,不会编程的人即是文盲。 1 为什么要学习R编程 大部分情况下解决某些问题还需要依赖一...
ggplot2绘图入门
I. 导论 1 什么是ggplot2 ggplot2是用于绘图的R语言扩展包,其理念根植于《Grammar of Graphics》一书。它将绘图视为一种映射,即从数学空间映射到图形元素空间。例如将不...
随机模拟的基本思想和常用抽样方法
通常,我们会遇到很多问题无法用分析的方法来求得精确解,例如由于式子特别,真的解不出来; 一般遇到这种情况,人们经常会采用一些方法去得到近似解(越逼近精确解越好,当然如果一个近似算法与精确解的接近程度能...
R语言多元分析
A. 主成分分析 主成分分析(principal components analysis, PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第...
ParaAT:编码蛋白质DNA序列并行比对工具
同源序列比对是生物信息学普遍采用的分析方法之一,其中,编码蛋白质DNA序列比对最为常见,在比较基因组学、分子进化学、系统发育等领域具有重要的基础作用。为获取相应的比对结果,通常采用的方法是先比对后回译...
迄今最详细人类基因组分析数据出炉
一项大型国际计划显示,与青少年在学校掌握的知识相比,人类基因组—— 一个人的遗传信息总和——包含有更多的蛋白质编码基因。当研究人员决定在上世纪90年代晚期对人类基因组进行测序时,他们专注于寻找那些用来...
迄今最详细基因功能图谱内容
在2001年,人类基因组计划产生了近乎完整的人类DNA。但是,研究人员还希望了解这些GS,CS,和TS是如何利用,控制或组织,比它们少得多的编码区域,造就活生生的人。 今天(9月6日),一个聚集了42...