不同染色体可能有相同的基因吗?染色体数目的谜题,谈谈只有一条染色体的酵母
酵母是一种人们熟悉的真菌,广泛用于酿酒以及面包和馒头制作中的发酵。酿酒酵母有16条染色体(单倍体),可是最近《自然》杂志上发表的一篇论文中,科学家们把16条染色体合而为一,创造了一个只有一条染色体的酵母。这是一篇具有里程碑意义的研究,而且作者是由中科院的覃重军研究员(图0)领衔的一群中国科学家,因此各大媒体争相报导,一时在网上引起非常广泛的热议。为了帮助大家进一步了解这一项研究,这里做一些稍微深入的解读。为了说明问题,我们不得不在文章中动用一些专业术语,这或许会让非专业人士感到头疼。不过,你即使跳过这些术语,也仍然会获得一些有趣的信息。
图0:覃重军研究员。
一、什么是染色体
染色体(chromosome)是由DNA和蛋白质组成的(图1)。人们最初在光学显微镜下观察到染色体的时候还不知道它的功能,只知道它很容易被染料染上很深的颜色,于是取名叫染色体。这个名字比较随便。如果当初的先贤能预料到它们的作用如此重要,或许会取一个深刻一些的名字。染色体中的DNA就是基因组的载体。真核生物中的染色质和染色体是同一物质,在不需要严格区分的情况下,我们统称为染色体。
DNA(脱氧核糖核酸)由脱氧核苷酸组成。每个脱氧核苷酸含有一个脱氧核糖、一个磷酸和一个碱基。DNA共含有4种碱基,就是我们经常说的A C G T。由于染色体DNA以双链的形式存在,我们常用碱基对(basepair, bp)来表示DNA链的大小(或者说长短)。1000 bp是1 kb,1000 kb是 1 Mb,1000 Mb是1 Gb。
我们知道基因组记载了生物生理结构和功能所需的全部信息。如果我们把基因组比作一部操作法,那么染色体就相当于这套《基因组》的若干分册,比如我们人类体细胞核里有46条染色体,此外线粒体中还有一条染色体,就像46本厚薄不一的书和一本薄薄的小册子。
图1:从DNA 到染色体。
二、大大小小的基因组
不同生物基因组的规模五花八门。既然基因组是生物结构与功能的操作法,那么复杂的生物理应拥有更大的基因组——这个推理是对的,基因组的大小与生物的复杂程度确实存在一定的相关性(图2),比如细菌的基因组通常比较小,大肠杆菌的基因组是4.6 Mb;而哺乳动物的基因组很大,人类的单倍体基因组是3.3 Gb。不过例外也很多:一些植物的基因组超过100 Gb,是人类基因组的几十倍;一些两栖动物和肺鱼的基因组也比哺乳动物的基因组大得多,而这些生物显然不如人类复杂。因为不同生物的基因组的“精炼”程度是不同的,就像字数多的书未必包含的信息就多,也可能是编写简单或者废话和乱码比较多。大肠杆菌的基因组大部分都用来编码蛋白质,而人类基因组中编码区不足2%。人类基因组一半左右的序列是转座子,另外还有很多其他的重复序列,这些序列的作用至今还了解很少。可想而知,那些两栖动物的巨大的基因组里这种不太有用的序列肯定比例极高。一般认为需要快速繁殖的单细胞生物的基因组会比较紧凑,这样可以节约能量,比如细菌的基因组。作为单细胞真核生物的酵母,有着与细菌相似的生活方式,它们的基因组也比较小。不过例外总是有的,有一种变形虫的基因组高达600多Gb,是已知最大的基因组,但这并不妨碍它们过着单细胞的生活。
图2:基因组大小的范围。
三、多多少少的染色体
既然基因组操作法是一部大书,那么这部书分成几册似乎也应该颇有讲究。原核生物的基因组只有一条染色体,也就是不管大小都是一册书,而且原核生物的染色体是环形的,相当于书没有封皮,无头无尾。真核细胞的线粒体和叶绿体起源于细菌,它们的染色体也是环形的。真核细胞核基因组的染色体则是线性的,而且通常不止一条,相当于一部书的分册,每一册都有书脊(着丝粒)和封皮(端粒)。按照我们日常的经验,一部书只装成厚厚的一本拿着很不方便,而且容易损坏,而如果装成很多薄本又会比较麻烦,所以应该在书的厚度与册子的多少上有一个权衡,册数应该有一个最优的范围。
图3:大西洋眼灰蝶
染色体并不是固定不变的。在一定条件下,一条染色体可以分为两条,两条染色体也可以合为一条。既然染色体处于动态变化中,理论上它们的数目似乎应该位于一个最优数目的附近。然而,事实远非如此,染色体的数目看上去好像具有很大的任意性。比如前面提到的酿酒酵母有16条染色体,而生活方式与之相近,基因组稍大的稷酒酵母却只有3条染色体。这还不算太离奇的。家蚕有56条染色体,而同为鳞翅目的大西洋眼灰蝶约有450条染色体,是已知染色体数目最多的二倍体生物(图3)。蜜蜂有 32条染色体,由于雄蜂是单倍体,有16条染色体,而同为膜翅目的生活在澳洲的杰克跳蚁(Myrmecia pilosula)只有一对染色体,它的雄蚁则只有一条染色体,可以说少到不能再少(图4)。我们很难想象大西洋眼灰蝶细胞平时要维护近1000个端粒会不会很麻烦,在有丝分裂的时候把450多条染色体排列在细胞的“赤道平面”上会不会很混乱,也很难想象杰克跳蚁那一条巨大的染色体会不会有些尾大不掉。生物到底如何权衡染色体的长短与多少,有没有最优解,我们至今还不知道。
图4:又蛰又咬,异常凶悍的杰克跳蚁只有一对染色体。这真是不以染色体多少论英雄啊。
四、染色体数目易变吗?
作为基因组的载体,染色体的重要性不言而喻。因此,人们容易下意识的认为染色体的数目是个很基本的特征,甚至有人认为人和黑猩猩的亲缘关系不会很近,因为它们的染色体数目不一样多。这其实是个很大的误解。染色体重要的是上面承载的信息,而不是宏观上的大小多少,这就好比对于不识字的人来说一套上下册的《红楼梦》与一套20册的《红楼梦》连环画很不一样,跟一套上下册的《西游记》看上去倒差不多,而识字的人就很容易发现前二者是同源的,跟后一个反而八竿子打不着。尽管人类有46条染色体,黑猩猩和大猩猩都有48条染色体,但黑猩猩与人的亲缘关系比黑猩猩与大猩猩的亲缘关系近。
除了人类,其他的大猿都有48条染色体。人类的祖先在和黑猩猩的祖先分开之后发生过一次染色体融合,现在人类的二号染色体对应其他猿类两条较短的染色体(图5)。
图5:黑猩猩的2A、2B染色体对应人类的2号染色体。
人类和其他大猿都是同科不同属的,而即使同属的生物染色体数目也不一定相同,比如人们熟悉的马和驴就都属于马属,马有64条染色体,驴有62条染色体(图6),马和驴可以杂交生育骡子,但骡子的染色体是奇数,在减数分裂时会发生错误,故而骡子基本都是不育的。当然,马和驴的染色体数目相差还不算多。小麂(Muntiacus reevesi)有46条染色体,而赤麂(Muntiacus muntjak)的雄性有7条染色体,雌性只有6条染色体,是已知哺乳动物中染色体最少的。麂属动物染色体数目巨大的差异作为经典的例子已被写入遗传学教材。
图6:驴和马相差一对染色体。
同属生物的染色体数目的差异说明染色体数目在进化中并不保守,而是个易变的特征。在进化中,越是底层的特征越不容易变化,越是高层的特征越容易变。比如体型、寿命都是一些高层的特征:同属于猫科动物的老虎和猫的体型就相差巨大;同属于豆科的槐树就是能活几百年的参天大树,而大豆就是一年生草本。染色体的长短与数目也属于高层的特征,在进化中是很不保守的。
五、16条染色体合而为一的意义
既然我们知道染色体的长短与数目的变化范围可以很大,而且它们在进化中确实易变,那么理论上把酿酒酵母的16条染色体合而为一就是可行的。酵母的基因组是12 Mb,而一条12 Mb的染色体并不算长。要知道人类最长的1号染色体有近250 Mb,最短的21号染色体(就是三体会造成唐氏综合症的那条)也有近47 Mb,因此12 Mb一点都不算长。既然昆虫都可以只有一条染色体(杰克跳蚁),比昆虫简单得多的酵母为什么不行呢?即便跟生活方式相似的另一种真菌稷酒酵母相比,稷酒酵母的一号染色体也有5.6 Mb。
不过进化中的易变并不意味着在实验室中就容易实现,更何况,即使是易变的特征在进化中的变化往往也是非常缓慢的,比如人类的祖先和黑猩猩的祖先是在约600万年前分开的,而酿酒酵母保持16条染色体的状态可能已经有一两千万年了。
当然事实也证明,这项工作的难度确实非常大。覃重军团队经过四年的攻关,最终有幸获得了满意的结果。这个只有一条染色体的酵母生活得很好,和野生型只有微小的差别,并且这种酵母还可以交配形成二倍体,减数分裂并产生孢子,也就是说,完全是个功能齐全的酵母(图7)。
这项工作的并没有提出什么新理论,但对现有结构的巨大改变以及短时间内完成了进化上需要百万年甚至更长时间的过程本身就具有重大的理论价值。这也是合成生物学的特征,不论克瑞格-文特合成支原体染色体,还是杰夫-布卡合成酵母染色体也都是这样的。而且在生命科学领域,技术革命的意义丝毫不逊于理论革命,我们熟知的PCR、基因测序、克隆哺乳动物、诱导多能干细胞、CRISPR基因编辑都是影响巨大的技术革命。工欲善其事必先利其器,强有力的技术是开启奥秘的钥匙。因此,说覃重军团队这项工作具有里程碑的意义是恰当的。
除了技术上的革命之外,研究本身也相当有价值,比如它显示了之前染色体间的相互作用可能被高估了。染色体上的信息虽然是线性的,但染色体(染色质)并不是像一团乱麻一样随便堆积在细胞核里,而是非常有序的。人们花了很多力气去研究染色体的组装与三维结构,包括不同染色体之间,以及同一染色体不同部位之间的相互作用。然而当16条染色体变成一条,染色体的包装与三维结构发生了巨大变化,基因的转录与细胞的生长变化却很小,这说明维持细胞生理功能的信息基本上就是染色体上的线性信息,而高维的信息作用不大,至少在酵母里应该是这样。
此外,这个只有一条染色体的酵母可能会是一个研究有丝分裂的好模型。原核生物虽然只有一条染色体,但没有有丝分裂;真核生物一般有多条染色体,只有一条染色体的雄性杰克跳蚁也不适合作为模型。现在人们有了一个只有一条染色体的模型生物,曾经的16个着丝粒和32个端粒变成了1个着丝粒和2个端粒,这应该会给有丝分裂、着丝粒、端粒等的研究提供很多便利。
图7:从16到1 的沧桑巨变。
六、覃重军和杰夫-布卡
有趣的是,在同一期《自然》期刊上,还发表了来自合成生物学大佬杰夫-布卡团队的一篇论文,作者们把酿酒酵母的16条染色体合并成了2条染色体。显然,杂志社是故意把日期接近的两篇论文放在同一期中,以便更好地调动媒体与读者的兴趣。
这两项研究的方案并不相同,布卡的方案是先把较短的染色体合并成较长的染色体,再把较长的染色体合并成更长的染色体。他们先做出了12条染色体的酵母,又做出了8条染色体的,然后是4条,最后得到了2条染色体的酵母。而覃的方案是老老实实地一个一个合并(每次都去掉一个着丝粒和两个端粒),因此从15条到1条染色体的酵母每种他们都有。这两种方案事先很难说哪一种更好,不过结果证明覃的方案似乎好得多。当然也可能覃做了更充分的准备,选择了更好的方案,赢在起跑线上了。
布卡不但最终没有得到只有一条染色体的酵母,酵母长得也不如覃的酵母好,而且随着染色体的合并产孢子的能力发生了剧烈的下降。酵母界与合成生物学界大佬的这项研究方方面面都输给了覃重军。本来那也是一篇意义非凡的研究,然而由于覃重军的结果太出色,以致布卡的研究似乎成了一个陪衬,专门来衬托覃的研究如何伟大。
为了满足读者的八卦心理,我们再多说说这两位科学家。
杰夫-布卡(图8)原是酵母界与转座子界的大佬,他最初主要研究酵母中的Ty系列转座子,后来也研究哺乳动物中的LINE-1转座子。他在CNS等顶级期刊上发表过很多高质量的论文,而且他很会培养人,他的很多学生和博士后后来成了名校教授。合成酵母染色体对于布卡来说是一件锦上添花的事,第一条染色体合成结果出来之前他已经是美国科学院院士。当他最初提出合成酵母染色体的想法时,约翰霍普金斯的教授们都觉得他异想天开(大佬也是保守的多啊)。他虽然坚持做了下去,但他当时的主要工作还是转座子;合成染色体很多工作甚至是本科实习生做的,直到第一条染色体合成成功,他才把主要精力转向合成生物学。合成整个的酵母基因组工程巨大,布卡找了很多合作者,其中有不少是中国的,包括华大、天大、深圳先进院等等。这次发表的合并染色体的论文作者只有四个人(包括他自己),看上去这一项工作对他来说可能不太重要,应该是他现在诸多工作中的一小部分,可能他本人也没有时间和精力对这项工作投入太多的思考。
图8:杰夫-布卡(Jef Boeke)。
覃重军以前是做放线菌领域的研究的,几年前才开始做酵母,他也没有发过CNS级别的论文。这次研究是他最主要的工作,为此投入了大量的精力,甚至还欠了研究所经费。这项研究对他来说不是锦上添花,而是志在必得。
由于前两年的韩春雨事件的教训,人们对名不见经传的中国科学家忽然做出一鸣惊人的发现往往有些担心。不过覃重军并不属于这种情况。覃重军世纪初海归进入国内顶级的研究院——中国科学院,并且后来获得了杰出青年基金资助。这些年覃重军一直都有SCI论文发表,尽管不是这次这样重量级的论文,但也都是实打实的工作。即便没有这次的突破,他依然是一位成功的科学家。覃重军这几年的艰辛与承受的巨大压力不言而喻,但他本身不属于那种面壁十年,一朝成名型的科学家。
覃重军目前五十出头,对一个已经打开局面的科学家来说还是年富力强的岁数,有望在今后做出更多重大发现。
图9:覃重军和他的团队。
七、其他问题
① 酵母是单倍体还是二倍体?
酵母既有单倍体,也有二倍体。单倍体可以交配(接合)成为二倍体;二倍体也可以通过减数分裂形成单倍体孢子。这一点很像有胚植物(苔藓、蕨类、种子植物)的世代交替。当然不是任意两个单倍体酵母都可以交配,单倍体酵母有不同的交配型,类似雌雄配子的情形。酿酒酵母的单倍体有16条染色体,在我们讨论点这项研究中被合并成了一条。这样的酵母交配形成二倍体则有一对染色体。酿酒酵母属于芽殖酵母,以出芽的方式繁殖。出芽是一种特殊的有丝分裂(图10)。
图10:酿酒酵母的生活史。
② 一条染色体的酵母是全新的人造生命吗?
这个问题很难回答,因为我们并没有一个满意的定义来描述全新的人造生命。一方面通过改变生物的基因获得一个自然界从前没有的生物都可以说是全新的生命;另一方面,转基因也好,合成染色体、合并染色体也好,都是在之前生命的蓝本上做了微小的改动,改变之后的酵母还是酵母,似乎也很难说是全新的生命。
③ 杰夫-布卡的名字
最近看到很多媒体上对Jef Boeke 名字的音译是“杰夫-博克”。本来音译是不唯一的,但还有一条原则是名从主人,即假如外国人已有自己的译名,我们应该沿用。Boeke自己落款的中文字样是“傑夫 布卡”,因此不宜译作“博克”,除非他自己也使用“博克”这一翻译。一般科学家并不在意外国人怎样翻译自己的名字,而布卡的合成染色体工作量巨大,需要大量合作者,其中有不少就是中国的科研院所。这可能是他同时使用英中文落款的原因。布卡是我的博士后导师的博士后导师,故我跟他有过简短的交流以及e信往来,听说过关于他的故事也比较多。