ClustalW是现在用的最广和最经典的多序列比对软件, Muscle是速度最快的多序列比对之一,T-coffee是越来越受到欢迎的软件.它们各自有什么优点和缺点呢? ClustalW不仅可以用来做多...
基因组注释介绍
基因组注释主要包括四个研究方向:重复序列的识别;非编码RNA的预测;基因结构预测和基因功能注释。我们将分别对这四个领域进行阐述。 1:重复序列的识别。 重复序列的研究背景和意义:重复序列可分为串联重复...
快速合并多个fastq.gz文件
案例描述: 需要将Sample_test1_R1.fastq.gz和Sample_test2_R2.fastq.gz合并为test.fastq.gz 操作方法1: 先zcat再gzip zcat Sa...
DNA测序技术原理及其进展
摘要:自1953年,剑桥大学科学家弗朗西斯.克里克(Francis crick)和博士詹姆斯华生(Jamers waston)发现DNA双螺旋结构以来,已经走过近60年。在这期间,有关DNA的研究如火...
R语言中的机器学习
转载自 R中文论坛(http://rbbs.biosino.org/Rbbs/posts/list/192.page) Machine Learning & Statistical Learn...
基因表达调控
从DNA到蛋白质的过程叫基因表达(gene expression),对这个过程的调节即为基因表达调控(regulation of gene expression or gene control)。基因...
NCBI的数据库介绍
GenBank Overview 基本信息 什么是GenBank?GenBank是一个有来自于70,000多种生物的核苷酸序列的数据库。每条纪录都有编码区(CDS)特征的注释,还包括氨基酸的翻译。Ge...
BLAST常见错误原因解析
常见问题 1.运行formatdb时报下列错误: [formatdb] ERROR: 1.seq.nhrOutput Blast-def-line-set.E.<title> Invali...
Ubuntu 安装与更新 GCC
一、程序下载 首先从GNU上下载GCC包,ftp://gcc.gnu.org/,我使用的是最新发布版本gcc-4.7.0.tat.gz, tar zxvf gcc-4.7.0.tar.gz cd gc...
R语言基础入门之七:方差分析
一、单因子方差分析(one-way ANOVA) 1)建模: 我们采用multcomp包中的cholesterol数据集作为例子,其中response为响应变量,trt为预测变量,这个处理中有五种水平...