熊荣川, 中国科学院成都生物研究所 在进行种群遗传学研究时,都会用到核苷酸多样性(π)和单倍型多样性(Hd)。 下面简单介绍怎样用软件 DnaSP v5(Librado et al.,2009)得到相...
qplot绘图函数快速入门
绘图是进行数据探索分析的重要方法,也是数据报告中的必备元素。但进行多元数据绘图时,R语言中的基本绘图工具往往很不给力,使用lattice包又要记一大堆命令。在你痛苦不堪的时候,需要ggplot2包来拯...
新成果颠覆蛋白质经典学说
一直以来学生们被教授蛋白质的三维形状对于它的功能是至关重要的,但原来许多的蛋白质是以“混乱”的状态存在且具有功能。 如果你打开任何一本生物学教材翻到蛋白质的部分,你将会学到蛋白质是由氨基酸序列组成,序...
超越5种碱基的DNA测序
DNA测序已经为科学家提供了丰富的关于生物系统的信息,不过迄今为止的研究大多集中在对基因组DNA序列和重亚硫酸盐处理后的碱基序列进行比较,分析四种标准碱基和5-甲基胞嘧啶。研究显示核苷酸的许多其他化学...
R语言中的色彩
统计学家经常唠叨这样一句话,“一张好的图片胜过千言万语。”绘图正是R语言的强项。其中的基本绘图命令就包括了大量的参数配置,完全可以满足各种出版物的需要,更何况还有lattice和ggplot2这两大格...
广义线性模型(GLM)
广义线性模型(generalized linear model, GLM)是简单最小二乘回归(OLS)的扩展,在OLS的假设中,响应变量是连续数值数据且服从正态分布,而且响应变量期望值与预测变量之间的...
利用R语言进行方差分析
一、单因子方差分析(one-way ANOVA) 1)建模: 我们采用multcomp包中的cholesterol数据集作为例子,其中response为响应变量,trt为预测变量,这个处理中有五种水平...
BLASR:PacBio数据比对工具
Pacbio数据相信大家都不陌生了,reads很长,但是错误很多而且错误分布在整条reads上而不是局部。这里给大家推荐一个工具BLASR(Basic Local Alignment with Suc...
用nls函数进行非线性回归
在许多实际问题中,回归模型中响应变量和预测变量之间的关系可能是复杂的非线性函数。有时候能通过变量变换的方法可以将其变为线性模型,有时则不能。在后一种情况下,就需要采取专门的非线性回归方法来建立模型。 ...
用图形和颜色来表现相关关系
进行数据分析建模首先要了解变量间的关系。对于连续数据来说,散点图可能是最为有效的一种工具。散点图通常对两组连续数据比较合适,如果是多元数据,那么可以使用散点图矩阵(ScatterMatrix)来两两展...