作者:牛登科
三十年前问这个问题?你得到的答复是内含子没什么用,属于垃圾DNA或者说分子水平的寄生虫。
但是后来,一个又一个基因的可变剪接现象被发现。尤其是人类基因组测序完成后,人类基因组中没有发现原来预期的基因数,生物学家普遍高度重视可变剪接,寄希望于大量的可变剪接来解释人类在生物学、行为学等方面的复杂性。令人鼓舞的是,高通量生物学研究确实也发现很大比例的基因会产生多种剪接产物(1)。哺乳动物中,从开始发现的百分之三四十,到后来的百分之八九十。考虑到我们研究的组织、细胞、发育时期、生物节律时间点有限,按此趋势类推,等研究足够深入以后,应该是几乎所有的包含内含子的基因均存在可变剪接。
这几年,你如果问分子生物学研究人员,内含子有什么用?很多人会毫不犹豫地回答,内含子存在为了可变剪接,一个基因编码多个蛋白质呀。
什么是可变剪接呢?看看上面这个图(来自http://en.wikipedia.org/wiki/Alternative_splicing),以最容易理解的内含子保留为例。一个内含子,有时候切掉,有时候不切掉,就形成了两种信使RNA。没切掉的那个,凭什么说它是有功能的呢?我可以认为它是剪接机器失灵,产生了废物。在很多人眼里,生物体是非常精密的仪器,不相信生物体会产生那么多废物。但如果你经常看是DNA修复、错误RNA的降解等方面的文献,注意到了生物体不灵光一面,就会觉得可变剪接产物是剪接废物也不是不可能。
怎样判断可变剪接产生的多种mRNA是有没有用呢?
最常见的方式是看近缘物种间同一类型的细胞产生的可变剪接产物是否一致。如果表型很相似的两个物种,分子水平乱哄哄差异很大,说明这些差异对表型没起什么作用。基于这种想法,最近一个研究发现(2),“the majority are due to erroneous splice site choice”。
但是,物种间比较也有问题。两个双胞胎兄弟都不可能完全像,不同物种之间表型差异总是存在的,也许就是这些乱哄哄的差异造就了人和小鼠的差别。可以说,我们的心肝脾肺肾和小鼠比,除了大小之外,差别不大。但我们的神经系统应该比它们复杂多了吧,会不会我们这么高级的神经系统就是建立在可变剪接的基础上呢?至少,神经系统的可变剪接文献超多(3)。
一个和稀泥的想法是可能性最大的:可变剪接产物中有的有用、有的没用。关键也许应该是哪些有用、哪些没用?
这样,内含子的问题又来了,既然一些可变剪接没用,也就不能用可变剪接解释所有内含子存在的价值。另外,就是有用的产生可变剪接的内含子,也不大可能一出现时就产生了有用的可变剪接。内含子的出现,用专业术语说是内含子起源或内含子获得,不能靠可变剪接来解释。
有些人认为,内含子产生时就是没什么用、甚至微弱有害的(4)。我们实验室一直在苦苦思考内含子存在可能的好处,至今已经发表了两个假说,提出了两种可能,对不对,我们自己也没把握(5)。我们论文的前言中也列举了其他人的一些假说,基本上都没有什么确切的支持证据,没有引起普遍重视。
补遗:
本来是想跟小同行交流一下,并把自己将来的教学材料在科学网存档。没想到科学网很鼓励我,给了个小红花。既然有了很多非生物学的读者,就有必要简单介绍一下内含子是什么东西。内含子是基因中的DNA片段,这些片段在转录后从RNA中切除掉,剩下的片段(称为外显子)连在一起,经过一些修饰后成为有功能的信使RNA。关于内含子的详细介绍请参考维基百科http://zh.wikipedia.org/wiki/%E5%86%85%E5%90%AB%E5%AD%90
(1)、这方面文献太多了,一查一大堆。感兴趣的网友自己查吧。
(2)、Noisy Splicing Drives mRNA Isoform Diversity in Human Cells 。 之前还有其他人做过类似研究,此文最新、最深入。
(3)、此类文献很多,这是一篇新发表的综述:Alternative splicing takes shape during neuronal development.
(4)、现在活跃的科学家中,Michael Lynch为持此观点的典型代表,感兴趣可以看他的一些论文http://www.indiana.edu/~lynchlab/
(5)、感兴趣的读者可以翻翻我们实验室2007和2011年在Biology Direct上发表的两篇假说,见我们实验室的网页或本人的ResearcherID。