在许多实际问题中,回归模型中响应变量和预测变量之间的关系可能是复杂的非线性函数。有时候能通过变量变换的方法可以将其变为线性模型,有时则不能。在后一种情况下,就需要采取专门的非线性回归方法来建立模型。 ...
用图形和颜色来表现相关关系
进行数据分析建模首先要了解变量间的关系。对于连续数据来说,散点图可能是最为有效的一种工具。散点图通常对两组连续数据比较合适,如果是多元数据,那么可以使用散点图矩阵(ScatterMatrix)来两两展...
不同版本的散点图矩阵
散点图矩阵是散点图的高维扩展,它从一定程度上克服了在平面上展示高维数据的困难,在展示多维数据的两两关系时有着不可替代的作用。R 软件就包含了各种不同版本的散点图函数,本文主要介绍散点图矩阵的设计及其在...
利用ggplot2显示二维统计量
ggplot2包可称得上是R语言中最为复杂和炫目的绘图包了。PLoB中也有一篇文章《ggplot2绘图入门》对该包进行了介绍。在今年,其版本从0.89升级到了0.90,升级后的新版本提供了许多新的功能...
利用ggplot将多个图形组合在一起
关于ggplot2作图的问题,不少人关心如何将多个图形组合在一起,下面给大家分享一个网上的例子,下图就是最后的结果。画这个图有几个障碍,一个是二维散点的置信椭圆,另一个是一维直方图的边缘显示。解决的方...
R语言编程入门
I. 导论 简单来讲,编程是借助计算机来解决某个问题。学习编程的就是训练我们解决问题的能力。有这样一种说法:在未来,不会编程的人即是文盲。 1 为什么要学习R编程 大部分情况下解决某些问题还需要依赖一...
ggplot2绘图入门
I. 导论 1 什么是ggplot2 ggplot2是用于绘图的R语言扩展包,其理念根植于《Grammar of Graphics》一书。它将绘图视为一种映射,即从数学空间映射到图形元素空间。例如将不...
随机模拟的基本思想和常用抽样方法
通常,我们会遇到很多问题无法用分析的方法来求得精确解,例如由于式子特别,真的解不出来; 一般遇到这种情况,人们经常会采用一些方法去得到近似解(越逼近精确解越好,当然如果一个近似算法与精确解的接近程度能...
R语言多元分析
A. 主成分分析 主成分分析(principal components analysis, PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第...
ParaAT:编码蛋白质DNA序列并行比对工具
同源序列比对是生物信息学普遍采用的分析方法之一,其中,编码蛋白质DNA序列比对最为常见,在比较基因组学、分子进化学、系统发育等领域具有重要的基础作用。为获取相应的比对结果,通常采用的方法是先比对后回译...