最近NCBI的数据格式由于空间缘故都转换成了*.sra格式,不再支持*.fastq.gz,因此需要一个特别的转化工具来转换下载的*.sra数据文件。 下载地址: http://www.ncbi.nlm...
进化理论及其发展
1、拉马克与进化论 "Do we not therefore perceive that by the action of the laws of organization . . . nature ...
趋同进化,趋异进化,协同进化
1 . 趋同进化 “趋同”即殊途同归的意思。它是指亲缘关系较远的生物,由于生活环境、生活方式相似而在长期的适应过程中所形成的体形或器官等异常相似的 现象。它是不同生物在相同环境条件下得到相同选择的结果...
如何在分子水平检测正选择
以下是杨子恒写于2000年的综述,转摘自集百家(http://www.dxyer.cn/tzeng/)。文中标{}的是原文中的英文词。恐翻译有差故而注出;标[]的是原文中参考文献的标号;标<&g...
基因数据库下载
下面是Ensembl上的基因数据库下载,主要是哺乳动物,包括基因组序列,核酸序列,蛋白序列,及这些序列在EMBL和NCBI上的注释,还有提供的MYSQL数据库文件,并对物种名称做了一下简单的翻译,方便...
三代测序数据pacbio数据处理
三代测序仪现在逐步投入正式使用之中,目前三代测序例如pacbio数据大的特点之一就是测序得到的reads特别长,最近我开展的一个项目中利用pacbio测序的到的reads中最长的到了23165bp,平...
几个多序列比对软件:Muscle,ClustalW和T-coffee的简单比较
ClustalW是现在用的最广和最经典的多序列比对软件, Muscle是速度最快的多序列比对之一,T-coffee是越来越受到欢迎的软件.它们各自有什么优点和缺点呢? ClustalW不仅可以用来做多...
基因组注释介绍
基因组注释主要包括四个研究方向:重复序列的识别;非编码RNA的预测;基因结构预测和基因功能注释。我们将分别对这四个领域进行阐述。 1:重复序列的识别。 重复序列的研究背景和意义:重复序列可分为串联重复...
快速合并多个fastq.gz文件
案例描述: 需要将Sample_test1_R1.fastq.gz和Sample_test2_R2.fastq.gz合并为test.fastq.gz 操作方法1: 先zcat再gzip zcat Sa...
DNA测序技术原理及其进展
摘要:自1953年,剑桥大学科学家弗朗西斯.克里克(Francis crick)和博士詹姆斯华生(Jamers waston)发现DNA双螺旋结构以来,已经走过近60年。在这期间,有关DNA的研究如火...