从19世纪60年代起,许多生物学家便开始着手重建地球上所有生命的进化历史,并以系统树的形式描述这部历史。传统上,构建系统树是利用化石证据,通过严密的推理或计算,来表示不同物种间遗传距离及进化顺序。但是由于化石的零散性和不完整性,使大多数研究者转向比较形态学和比较生理学的方法。通过这两种方法,经典进化学家己得出有机体进化历史的主要框架。然而形态和生理性状是如此复杂,以致不可能产生一幅进化历史的清晰图像。分子生物学的进展大大地改变了这种局面。由于所有生物的蓝图都用DNA(在某些病毒中用RNA)来书写,因而人们以通过比较DNA来研究它们的进化关系,即DNA分子进化。
分子进化是生物分子层次上的进化,分子系统学是从生物大分子(蛋白质、核酸)的信息推断生物进化历史,或者说重建系统发育关系,并以系统树形式表示出来。分子进化从组织层次上说是生物组织的基础层次的进化,有两个显著特点:进化速率相对恒定和进化的保守性。生物大分子进化速率相对恒定是建立分子系统树的理论前提。近年来一些重要的分子系统学研究进展主要有:(1)生物进化系统的3条主线,即30多亿年以前,整个生物界就分为原始真核细胞生物、原始真细菌和原始占细菌三大界。(2)分子系统学的研究支持了真核细胞的共生起源说。(3)分子系统学的研究结果大部分与传统的根据表型比较而建立的系统树相符合,但也有一些与传统的系统进化观点不吻合的结论。(4)揭示了一些过去表型系统树上模糊不明的或争论未决的系统进化问题。
由于化石记录的不完备性,再加上化石形态较难辨别,使得仅靠化石记录推测各生物类别的起源时间特别困难。从逻辑上讲,随着越来越多的化石证据的发现,各生物起源的时间只会整体向前推移,但仅依靠化石证据只能通过新的化石记录的发现一步一步地向前推移。如何有效而准确地推测一些生物类别的起源时间,最佳的办法是将化石记录与分子进化的方法相结合。但是从目前的现状来看,分子物钟所推测的时间总是早于化石记录。判别分子钟所推导的时间的可靠性,一方面要靠化石记录来证实,另外占DNA的资料也为验证分子生物钟的方法提供了一条新的途径。分子钟理论尽管只是一种假说,但它己经成为演化分子生物学的一个热点。大多数现代分子生物学家常常据此进行分子进化机制的研究,并推算现有一些重要生物的起源时间。正确地估算与应用分子钟,对于我们充分利用分子水平的进化信息,探寻分子水平的进化规律,了解物种分子水平的进化过程有重要意义。另外,分子钟的发现与中立论的提出,极大地推动了进化尤其是分子进化研究,填补了人们对分子进化即微观进化认识上的空白,推动进化论的研究进入分子水平,并建立了一套依赖于核酸、蛋白质序列信息的理论方法。分子进化研究有助于进一步阐明物种进化的分子基础,探索基因起源机制,从基因进化的角度研究基因序列与功能的关系。
DNA分子进化的理论基础——分子钟假说
分子进化是生物分子层次上的进化,从生物大分子(蛋白质、核酸)的信息推断生物进化历史,或者说重建系统发育关系,并以系统树的形式表示出来。例如,通过对古代生物遗骸中DNA的分析,直接揭示了占代生物极其重要的遗传信息,可使人们在分子水平上自接发现漫长年代中生物种群的系统发生和演变规律。尤其重要的是,应用分子钟假说,人们可以根据现代基因库的材料以及占DNA的证据在分子水平上讨论和推导不同生物门类的起源和进化。
分子钟(molecular clock)
分子钟假说最早由Zuckerkandl和Paining于1965年提出。他们认为生物的分子进化过程中普遍存在有规律的钟,即分子进化速率近似恒定。因此,分子钟假设成立的先决条件是对于任意给定的大分子(蛋白质或DNA序列)在所有进化谱系中的进化速率近似恒定的。严格地说,对长期进化而言,基因或者基因产物蛋白质都不可能以恒定速率变化,因为一个基因的功能可能发生改变,特别是在从简单有机体向复杂有机体的进化过程中,或者环境条件发生变化使基因组的基因数口增加更是如此。此外,DNA损伤及其修复机制也因有机体类型而异。正因为如此使得任何试图发现具有通用分子钟的基因都是徒劳的,因此分子钟不必具有通用性。
分子钟假说提出后,一些传统分类学家对其提出了质疑,认为分子钟的相关理论是在对“虚拟”的自然过程进行的分析和检验,但这个假说仍然激起了科学家利用大分子研究进化问题的极大兴趣。原因在于:首先,如果大分子进化速率恒定,就可.用来测定物种分歧时间和其他类型的进化条件,这类似于利用放射性同位素测定地质年代。而且,速率恒定条件下重建系统发育关系也比速率不恒定条件要简单得多。另外,谱系间变异速率的程度对分子进化机制的研究提供更多的观点。根据分子钟假设,可以通过基因序列间的分歧度及序列的平均置换速率来估计速率恒定分支间的分歧时间,这一间接时间数据,可与化石记录所反映的自接数据进行比较。因此,分子钟研究为探究化石生物类群的分歧时间也提供了一个新的途径,它不仅可用来对基于化石记录的传统结论加以验证,同时对于化石记录不完整的生物类群的起源历史的推测具有特殊意义。分子钟研究为人类学家、生物学家和古生物学家的工作提供了一套丰富而独立的结果。
物种分歧时间计算原理和方法
如图1所示的分子系统树中,设A, B为比较类群,O为参照类群,X为A与B的共同祖先,T1为A与B的分歧时间( divergence time ),T。为O与X的分歧时间。在分子钟假设下,核酸置换速率r应当是恒定的。上述分歧时间可用下列公式计算:
图1 AB类群及参考类群O,相应的分歧时间为T0,T1
相对速率检验(relative-rate test)
欲根据分子钟来利用序列间的分歧度及平均置换速率来估计物种分歧时间,相对速率检验是一个不可缺少的步骤。Sarich和Wilson提出的相对速率检验,是一种统计检验法,用于检测分子系统树中不同分枝上核酸置换速率的差异显著性,从而检验各类群的进化速率,寻找进化速率恒定的谱系。该方法是检验分子钟假设正确与否的有效上具之一,相对速率检验的原理如图2。
图2 相对速率检验
C是A, B两个簇(cluster)的外群。La, Lb分别是A, B从共同祖先分歧后每个位点的替代数,也就是枝长。定义s =La-Lb,结果依赖于s在统计上的显著性。用z统计来衡量。 相对速率检验是针对两个进化谱系间的分子钟检验,并不为谱系三的进化速率提供信息。并且,相对速率检验不能检测出谱系内的速率变异。
分支长检验(branch-length test)和二簇检验(two-cluster test)
针对相对速率检验面临的问题,许多学者提出一系列检验方法,以便同时用很多序列来检验分子钟假说。使用最多的就是Takezaki等(1995)提出的两种分子钟检验方法:分支长检验和二簇检验。这两种检验法都是应用于同一类系统树,即用不需要恒定速率假定的构树法获得拓扑结构,并用外类群序列定出树根。二簇检验的原理是检测两个各有多序列组成的簇的平均替代率是否相同,其中两簇由一个给定树的节点定义。如图3所示,二簇检验检验是否从节点N到簇A和B的顶点的平均距离有显著差异。在速率恒定的假定下,二者间差异的期望值为0。
在分支长度检验中,检测根到顶的距离与除外类群序列外的所有平均数的偏差根到顶端的距离指的是根到每一个序列的分支长度。如图4所示,xl=bl+b5,x2=b2+b5, x3=b3, x的平均为Xavg=(bl+b2+b3+2b5 )/3。如果速率恒定,则x与Xavg的差异的期望值为0。
图3 二簇检验
图4 分支长检验