你的遗传密码,究竟来自何方?

导读:GTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGCTGCAGTTAAAAAG这看起来像是错按键盘打出的乱码,但这条DNA序列确实意义重大,它存在于你身体的每一个细胞中,在你养的猫狗体内,在你盘中的鱼、花园中的蜜蜂与蝴蝶,甚至你肠道的细菌中。

GTGCCAGCAGCCGCGGTAATTCCAGCTCCAATA GCGTATATTAAAGTTGCTGCAGTTAAAAAG


    这看起来像是错按键盘打出的乱码,但这条DNA序列确实意义重大,它存在于你身体的每一个细胞中,在你养的猫狗体内,在你盘中的鱼、花园中的蜜蜂与蝴蝶,甚至你肠道的细菌中。事实上,你在地球上任何地方找到的生物,从深海底沸腾的热泉生物到云端的冰冷细菌,都拥有这条DNA序列。甚至,在一些严格意义上并不算有生命的东西,比如一种叫做“拟菌病毒”的巨型病毒里,你也能找到它。


    这条DNA序列分布如此广泛,是因为它诞生于所有生命的共同祖先体内。它担负着一项决定性的任务,所以几乎从未改变。换一种方法说,你体内一些DNA的年龄不可思议地高达30亿岁,从你的几万亿代祖先那里传递给你,链条从不曾中断。


    你的另一些DNA则是崭新的。你的基因组大约有100个基因突变是你父母没有的,小到仅仅一至两个核苷酸的改变,大到大段DNA的得与失。


    通过基因组对比,我们可以确认哪些DNA是新的,哪些是老的。例如,对比你跟兄弟姐妹的基因组,可以将崭新的基因突变揭示出来。将人类基因组与动物的作比较,能够揭示出更早期的改变。


    我们的基因组不仅是造人的“配方”,还是活生生的历史记录。基因组由60亿个核苷酸组成,足够写满一堆十米高的书藉,正因为它们是如此巨量,才能记录我们过去的点点滴滴,允许我们追溯从现在到生命之初的整个演化历史。


    虽然我们破译这些记录的工作才刚刚开始,但我们已经发现,自己的祖先不止面临着血肉相博的生存竞争,还经历了史诗般的基因组战役,这改变了基因组的运作方式,使我们成为现在的我们。


    共同祖先


    太初有RNA。它是一种“多才多艺”的分子,不仅能存储信息,还能催化反应。这意味着,一些RNA可以自我复制。一旦一个或一套RNA开始自我复制,最早的基因组便诞生了。


    RNA的缺点在于不是特别稳定,因此很早的时候,生命体就开始在另一种分子——DNA上储存信息。DNA的化学骨架和RNA略有不同,更不容易断裂。蛋白质也取代RNA成为催化剂,RNA则降级为DNA与蛋白质之间的中介角色。DNA存储制造蛋白质的信息,并向蛋白质工厂释放相应的RNA副本。


    那个曾经被RNA主宰的世界,留下的许多遗迹仍存在于我们的基因组中。比如文章开头提到的那段无处不在的基因序列,仍编码一种RNA酶的一部分。这种RNA酶在蛋白质的合成过程中仍然起着关键作用。


    大约35亿年前,出现了一种含有基因组的生命体,被称为所有生命的最近共同祖先(LUCA,Last Universal Common Ancestor of all life)。它的基因组由合成RNA和蛋白质的配方组成。在美国马里兰州贝塞斯达国家卫生研究院研究生命演化的尤金·库宁(Eugene Koonin)说,至少100个基因确信源于LUCA,而LUCA可能总共拥有超过1000个基因。


    虽然与我们所知的现代生命长得不一样,LUCA拥有许多在现代生命中仍可找到的核心体系,包括蛋白质制造体系。一些研究者相信,LUCA绝不是一个独立的、有膜包覆的细胞,而是一堆混合体——一些类似于病毒的元件,在无生命隔间(比如碱性热液喷口的孔洞)里面进行复制。


    分离与重聚


    接下来可能发生的情况是,LUCA中那些“类病毒元件”,在两个不同的场合下脱离大部队,获得了细胞膜,各自变成了简单的细胞。这可以解释为什么会有两种截然不同的简单细胞——细菌和古菌,二者拥有完全不同的细胞膜。库宁说:“这是非常吸引人的假设。”可以肯定的是,生命在很早的时候就分成了两大枝条。


    细菌与古菌演化出了一些奇妙的分子机器,并且改变了地球,但它们自己仍然只是一小包一小包的化合物。直到发生了一件非同寻常的事件,将这两大分枝重新聚合成一个复杂细胞,即真核细胞。这一事件改变了基因组,也为第一批动物的出现铺平了道路。


    距今大约10亿年前,一只古菌“吞食”了一只细菌,但它们并没有互相残杀,反而它们携手形成了一种共生关系,细菌的后代逐渐担负起了一个重要角色——线粒体,成为了细胞内供应能量的工厂。


    如果没有这次联合,复杂生命或许根本不会出现。我们倾向于假设,简单有机体向复杂个体演化是自然趋势,但细菌和古细菌的复杂度都没有演化得超出某一水平。原因何在?


    英国伦敦大学学院的尼克·莱恩(Nick Lane)说,这是因为它们遇到了一个能垒。所有的简单有机体都利用细胞膜产生能量。当它们变大时,相对表面积变小,因此不能产生足够的能量,所以结果是简单的细胞就得小——而小细胞没有足够的空间容纳大的基因组。通过提供模块化的独立能量来源,线粒体突破了这一障碍。细胞只需要制造更多线粒体,就能够变得更大。相应地,基因组得以扩充,信息存储能力也有效提高。


    除了让细胞从能量困境中摆脱出来,线粒体的祖先还是我们多达3/4基因的源泉。最古老的细菌大约拥有3000个基因,它们中的大多数都随着时间流逝或消失,或进入主基因组中,只给现在的线粒体留下了少量的基因。


    尽管益处显而易见,但和线粒体的祖先缔盟也存在极大的危险。特别是,最早的线粒体基因组里到处都是寄生DNA。这些寄生DNA被称为转座子(transposon),除了不停复制自己之外什么都不做。有时它们在基因中段定位,携带大量不相干的DNA形成内含子(intron)。这就像在一本熬汤菜谱中夹了一段糕点配方一样。


    但是结果并不总会带来灾难,因为这些内含子可以“自我剪切”:在基因转录成RNA——这是制造蛋白质的第一步——之后,它们会把自己删掉。但这个过程并不总会发生,因此内含子的存在是有害的。绝大多数细菌基因中没有内含子,因为细菌数量众多,相互之间竞争激烈,自然选择会残酷地将有内含子的个体剔除。然而,早期真核细胞数量极少,因此自然选择作用较弱,古老线粒体上的“遗传寄生物”便开始疯狂进行自我复制,最终导致基因组上有成百上千的内含子。


    现在,我们的每一个基因平均有8个内含子,它们中的绝大多数可追溯至最早的真核生物——我们的祖先始终没能摆脱它们中的大部分。相反,祖先演化出了一些方法来应对它们,比如改变基因的结构以及细胞繁殖的方式。性,便是其中之一。


    性的优势


    性的关键作用不仅是不同个体基因的混合——虽然这很重要,能将不同谱系里出现的演化优势综合起来,但单细胞生物早就在交换基因而不劳烦性了。


    性还涉及到一个过程,被称为“重组”(recombination)——性细胞在分裂为精子或卵子之前,染色体会交换相对应的片段。当你的基因组是很多基因像项链上的珠子那样串起来的时候,必然要面临一个很基本的问题——而重组就是解决方法。


    想象一串项链上有一颗珍贵的珍珠,挨着另一颗有瑕疵的珍珠。如果不能对单颗珍珠进行替换,你就只有两种选择:要么将整串项链扔掉,要么全部留下。同样的道理,如果有益突变邻近有害突变,要么有益突变会丢失,要么有害突变会被它的好邻居拽着,一起传遍整个种群。


    “重组”提供了一个交换珍珠的机会。通过交换单颗珍珠,你可以得到一条完美项链和一条满是瑕疵的项链。同样的道理,你的一些后代会获得大量的优秀基因,另一些则会得到大量有害基因——里面可能还有破坏性的内含子。不幸的个体极易死去,而优秀个体将存活下去。


    大种群里会产生大量突变,其中总有一些能够抵消有害基因的影响,因此不太需要借助重组之力。对于小种群而言,性就胜出了。也正因为如此,性成了最早的真核生物及其绝大部分后代的标准配置。因此,下一次你在享受鱼水之欢的时候,一定不要忘记感谢古老的细菌祖先将性爱之乐的寄生基因保留至今。

 

    到了性演化出现的时候,已经有太多的内含子,没法全消灭。因此早期真核生物很快就面临了另一个严重问题:随着内含子获得越来越多的变异,自我剪接机制开始失效。相应地,早期真核生物演化出了一种特殊机制,被称做“剪接体”(spliceosome),会将内含子从转录后的RNA上剪下来。


    剪接体是演化产生的一种不够“灵光”的解决方法:从RNA上剪下基因的无用片段,比直接从DNA上剪下来,效率要低得多。更严重的是,剪接体反应较慢,许多RNA都已经到达蛋白质工厂了,内含子仍未剪掉,便导致了缺陷蛋白质的产生。


    库宁推测,这就是细胞核出现的原因。一旦一个细胞的DNA被封闭在一个相对隔绝的空间中,远离蛋白质工厂,只有剪接过的RNA可以进出,就可以防止细胞浪费能量去制造无用的蛋白质。


    但这也无法解决所有问题,剪接体常常误将基因的编码序列(被称为外显子)剪掉,从而产生蛋白质的突变体。库宁说:“可变剪接不是一种适应,而是有机体不得不去应付的一件事情。”


    因此,我们的古老祖先演化出了一层又一层的复杂机制,以应对内含子的增加,但这还是无法解决它们引起的所有问题。不过,与简单细胞不一样,它们能量充裕,已能负担得起这样的浪费。同时,长远来看,这样的复杂化也蕴育了新的良机。


    多功能与调控


    内含子的存在,导致了外显子的出现,从而使基因更加模块化。在一个连续不间断的基因中,基因片段得失而产生的突变,往往会改变剩余基因的读码方式,从而产生混乱。相反,外显子能在不干扰基因其余部分的情况下被移动。于是,基因现在有了新的演化方式:在基因内部和基因之间重排外显子。


    比如说,想象一个偶然的突变将一个额外的外显子添加到一个基因上。由于可变剪接的存在,原始版本的蛋白质仍能被制造出来,但这也意味着同一个基因能产生一种新的蛋白质。这一突变可能没有太多影响,因此不会被自然选择剔除。但久而久之,新的蛋白质有可能担当新的功能。这纯属偶然,但真核生物这种不“灵光”的应对内含子的方法,却让它们的基因变得功能更加多样化,演化上也更灵活了。


    如果关于复杂细胞演化的这种观点是正确的,我们基因组的诸多关键特征,从模块化基因到性,就都是线粒体寄生基因存在的直接结果。其他学说无法被完全否定,但这是最漂亮的解释。库宁说:“这是我最喜欢的场景。”


    所有这些新奇的特征导致了演化变革的大爆发,真核生物不仅生存了下来,还很快开始分异。尽管如此,它们仍然面对着新型寄生DNA及病毒入侵的猛烈攻击。不过,在超越简单细胞的大小限制之后,复杂生命体能自由演化出越来越复杂的防御体系。


    其中之一便是给DNA加标记,使转座子的寄生性基因沉默,从而阻止这些基因制造RNA副本——这被称为甲基化作用(methylation)。另一种方法是,破坏入侵病毒的RNA来禁止其自我复制。这些防御方法仅部分有用。现在,人类基因组中约5%由突变的、大部分没有活性的病毒残余组成,但令人惊讶的是,有多达50%的人类基因由转座子的残余组成——这也足以证明,有多少次这些寄生物设法闯入了我们祖先的基因组,并肆虐开来。


    这些防御体系很快就被委以另一项重任:调控细胞自身基因的活性。加拿大圭尔夫大学的瑞安·格雷戈里(Ryan Gregory)是研究基因组演化的专家,他说:“原本调控转座子的机制成了调控基因的机制。”


    塑造身体


    大约在8亿年前,演化进入到一个新的阶段,细胞开始了从未有过的密切合作关系。虽然有少量细菌是多细胞的,但复杂程度上的限制使它们绝不会在这条道路上走得太远。相反,真核生物则利用一系列的契机进入了多细胞演化阶段,最终产生了高度复杂的有机体,如真菌、海藻、陆生植物,还有动物。


    原因之一便是它们越来越丰富和大型化的基因组,这些基因组被委以新的重任,比如将细胞联接起来并相互交流。更重要的是,这些基因的模块化本质使得更快速的演化得以发生。例如,将细胞联接起来的蛋白质由横跨细胞膜的和向外突出的两部分组成。由于基因的模块化,蛋白质各种不同的向外突出部分都可以与横跨细胞膜的部分锚接起来,就像吸尘器能配上不同形状的吸嘴。许多控制多细胞性的关键基因,都是通过外显子重排演化出来的。


    另外,真核生物控制基因的复杂机制能够使细胞更加专业化。通过控制不同基因的表达与否,不同的细胞群可以扮演差异极大的角色。于是,有机体开始发展出不同类型的组织,使早期生命从简单的海绵类生物逐渐演化为拥有复杂体征的动物。


    接下来的一次大跃进,是几次遗传“意外”的结果。繁殖过程发生错误时,有时整个基因组都可能被复制——在所有脊椎动物的祖先身上,这样的偶然事件不止发生了一次,而是两次。


    这些基因组的复制品产生了大量额外的基因副本,其中的绝大多数都遗失了,另外一些却承担起了新的角色。特别是,这样的重复复制产生了4组Hox基因,这是一种在发育过程中塑造身体的主宰基因,在内骨胳的演化过程中扮演着极为关键的角色。


    整个基因组的复制是少见的,绝大多数新基因都来自较小的重复复制,或外显子的混杂,或二者兼有。演化可不知羞耻——不管DNA从何而来,只要是有用的,演化都要利用它们。一些关键基因源于垃圾DNA,另一些则来自其他地方。


    例如,大约在5亿年前,我们祖先的基因组被一种称作hAT转座子的寄生基因入侵。它能通过一种“剪切与粘贴”机制来复制自己。这种“剪切”的过程,由与特定DNA序列结合的两种酶来实现。


    早期脊椎动物演化到某一时间点,DNA剪切酶所结合的序列出现在了与辨识入侵的细菌与病毒有关的基因附近(或是插入到了这个基因内部)。结果便是,在个体的整个生活史中,只要它的细胞进行复制,hAT酶就会剪切掉这个基因的一部分。关键是,在不同的细胞系中,被剪切掉的部分不相同,这便形成了大量不同的蛋白质突变体。


    在某些情况下,这种变化是救命的,因为变异蛋白质更适合锁定入侵病原体。很快,一种用于辨识能合成最有效突变体的细胞,并促进其快速复制的机制产生了,这就是免疫系统。现今人类的免疫系统复杂得难以置信,但其中的两种调控剪切与重排基因的酶正是hAT酶的直系后裔,是靶定入侵者的关键环节。所以,我们要感谢那种古老的“寄生虫”,带给了我们防御疾病的最有效武器。

 

    人类基因组


    配备了这些先进武器,再加上能够产生各种身体形状的遗传工具箱,早期脊椎动物异常成功。它们占领了海洋,攻陷了陆地,攀上了树木,最后从树上下来,用两条腿直立行走。


    是什么使我们与其他猿类差异甚大?一个显而易见的区别在于:我们拥有23对染色体,而不是猿类祖先的24对。但是染色体本质上就是个装基因的袋子而已,只要我们需要的基因还在,不管染色体分离了还是融合在一起都没什么区别。其实,看起来是一系列小变化的积累才逐渐改变了我们的大脑与身体。我们已经辨识出了一些关键变异,但可能仍有成千上万个没被发现。


    回顾全局,细胞和身体复杂性的增加显然是始于基因组复杂性的增加。不过让人震惊的是,最初基因复杂性的增加是由于自然选择的缺失,而不是在自然选择的引导下完成。格雷戈里说:“基因层面上发生的绝大多数事情,可能都是中性的。”


    换句话说,会有很多突变即使带来了影响,影响也很小,比如基因重复。在大种群中,这种变异很快就会丢失。但在小种群中,它能通过遗传漂变随机传播。库宁说:“这是群体遗传不可避免的结果。”只有到后来,比如重复复制的这个基因获得新的功用之时,这样的复杂性才会被自然选择所选中。


    许多人类史上的关键事件,如产生Hox基因的基因重复复制,可能是某个小种群在没有什么选择压力的情况下出现的。事实上,正是人类出现之初种群数量上的一次“瓶颈”事件(即全部人类的数量下降到某个极小数值),能够解释引起人类与猿类巨大差异(比如肌肉力量的降低)的变异为何能够分布得如此广泛。


    另一个惊人事实就是,病毒与寄生基因也发挥着重要的作用。我们基因组的许多主要特征,从性到甲基化,都演化自对病毒与寄生基因入侵的抵抗。更有甚者,我们体内相当数量的基因和外显子,如免疫酶类,都直接来自于这些入侵者。库宁说:“从一开始,病毒就是细胞生命的必要组成部分。”


    虽是必要,却并不舒服。我们的演化付出了巨大的代价。他们都说历史是由胜利者书写的,那么好吧,我们的基因组就是一部充满了各种实验的胜利史。这些实验要么是成功的,要么至少没把祖先杀死。我们是一长串乐透彩票中奖者的后裔,这个彩票的奖品,就是生产能够继续繁衍后代的后代。在这条道路上,有不计其数的失败者,超过万亿的动物都没能存活下来。


    我们的基因组离优秀与完美还相差很远,相反,它是将遗传事故的残余与古寄生物的遗存简单拼接起来的产物,它是某种会受到伦理学范畴批判的疯狂、无序实验的产物。这个过程持续至今:去到任何一家医院,很可能都会发现死于可怕遗传疾病的婴儿,但死亡率已不像过去那么高了。多亏了胚胎筛查之类的技术,我们开始有能力控制人类基因组的演化了。一个新的纪元即将来临。

热门评论
请先 登录 再做评论~
发布

Copyright © 2009-2024 药智网YAOZH.COM All Rights Reserved.   工信部备案号:渝ICP备10200070号-3

渝公网安备 50010802001068号

投诉热线: (023) 6262 8397

邮箱: tousu@yaozh.com

QQ: 236960938