鸟类“生命之树”
2014年年末之际,一棵长着48种鸟类的“生命之树”,出现在美国《科学》杂志的年终盘点中,它与人造探测器登陆彗星、干细胞治疗糖尿病等科学发现并列,成为他们选出的2014年全球十大科学突破之一。
在2014年12月12日出版的《科学》杂志上,以专刊形式发表了八篇关于鸟类演化最新论文,这一系列研究展示了有史以来最可信的鸟类演化树以及诸多鸟类演化中的重要事实。
这一系列研究的背后,是全世界200多名科学家历经四年的努力,而领衔这一研究的是几位年轻的中国学者。四年前,当时年仅28岁的中国科学家张国捷发起了这个日后引起巨大反响的项目。项目完成时,参与这个项目的中国项目组成员平均年龄还不过27岁。
另一个引人注目的事实是,张国捷和他的团队背后,并非中国主流的体制内大学或科研院所,而是近年来在基因测序领域表现亮眼,被外界称为生物界的“富士康”的深圳华大基因。
演化树(Tree of Life),也称为生命之树,用来表明各个物种之间的演化过程与亲缘关系。通常,一目了然的演化树看上去并不复杂,但其产生过程却没那么简单,科学界在确定一个物种演化树的主干、分叉、细枝末节时相当困难,甚至经常出现争议、倒退的过程。
鸟类的演化树亦如是,数百年的争论之后,2014年末的这棵鸟类“生命之树”,获得了学术界的普遍认可。
重现历史
鸟儿虽小,却是远远早于人类出现的生物,在人类历史的发展中亦有不可或缺的作用。但是人类对鸟类的了解比较有限,现代鸟类的演化历史和其之间的亲缘关系是困扰了演化生物学界数个世纪的未解之谜。
1859年,达尔文出版《物种起源》,两年之后,始祖鸟化石的发现为连接爬行动物和现代鸟类提供了关键证据,为进化论提供了最直接的支持。在那之后,鸟类起源于恐龙的假说,也得到了大量化石证据的支持。
近年来,恐龙向鸟类的转化已经成为了支持度最高的主要演化事件之一。
大约6600万年前的大规模物种灭绝事件,造成地球上包括恐龙在内的大部分动物与植物物种灭绝。然而,鸟类却是这次大灭绝事件中的幸存者,并利用大灭绝之后有利时机,在短期内经历了一次物种“大爆炸”,迅速演化形成了超过1万个不同物种。
但是要知道这一过程如何发生,就要通过基因组分析,理清它们演化的过程。 “物种从何而来,如何演化,如何发展,是生物演化研究中最基础的问题。基因组的应用使我们得以重现历史,回答这些最根本的科学问题。”张国捷对财新记者表示。
“这是迄今为止对同一类群物种最大规模的基因组演化历程分析,也是我们利用比较基因组学揭示生物宏观演化历史的重要一步。”张国捷说。
来自华大基因和中国国家基因库的张国捷、美国杜克大学和霍华德休斯医学研究所的恩里克·哈维斯(Erich D. Jarvis)和丹麦自然历史博物馆的托马斯·吉尔伯特(M. Thomas P. Gilbert)是“国际鸟类基因组联盟”的三位核心研究者,这个庞大的联盟包括了来自全世界80多所研究机构的200多名科学家。
从2011年开始,国际鸟类基因组联盟完成了48个鸟类物种的基因组测序、组装和全基因组比较分析。这48种鸟包括乌鸦、鸭、隼、鹦鹉、企鹅、朱鹮、啄木鸟、鹰等,囊括了现代鸟类的主要分支。
在揭秘48种鸟类完整的遗传信息之后,通过比较、分析全基因组信息,他们就基本确定了现代鸟类之间的“亲属关系”。
这些新发布的成果在许多鸟类演化相关问题上提出了新观点。例如,全基因组分析的结果推翻之前“现代鸟类的扩张发生在大灭绝事件之前的1000万-8000万年”的假说,进一步强化了鸟类的物种“大爆炸”理论,即鸟类物种的大规模出现是在6000万年前恐龙灭绝之后的1000万至1500万年间出现的。而现在许多常见鸟类的共同的祖先,就是曾处于食物链顶端的食肉动物。
除了上述确定了争议已久的鸟类演化树的研究之外,另一篇综合性文章则描述了鸟类基因组演化的历程,从基因组的角度阐述了鸟类宏观演化的重要特征。与其它脊椎动物相比,鸟类的基因组要小很多,只有哺乳类平均基因组大小的30%-40%,许多祖先存在的基因在现存鸟类中丢失了。这些丢失的基因对鸟类的演化会产生很大的影响。比如,牙齿相关基因的丢失解释了现存所有鸟类都没有牙齿,卵巢发育相关基因的丢失决定了现代鸟类只有单一功能的卵巢。
同时在《科学》专刊上发表的几篇文章,还揭示了鸟类演化中的一些重要细节。例如,控制声音学习的分子通路如何在一些鸟类和人类的大脑语言控制区域中独立演化出来;鸟类的性染色体复杂的演化历程;在早期演化过程中,鸟类是如何一步步丢失牙齿;鸟类近亲鳄鱼的基因组是怎样演化的;鸟类歌唱行为在大脑内的基因调控机制。
“这些研究成果为我们提供了一个经典研究”,《科学》杂志资深编辑劳拉·赞恩(Laura Zahn)评论称,此次国际科学家联盟取得的成果提供了了解鸟类起源和生物学的新信息,在鸟类研究文献和比较基因组学均意义重大。
多国部队
“全世界各地的媒体采访邮件我接到了100多封,”张国捷说。早在2014年初,他们就大概得知了会有专刊发表的消息。甚至更早之前,在慢慢集结起国际科学家的研究联盟之时,张国捷就隐隐感到,这个项目将会有丰硕的成果产出。
这项200余研究者参与的大型研究的起点,是张国捷刚刚博士毕业时的一个念头。
“鸟类的项目源于一个与鸽子相关的研究,”张国捷介绍,2010年,他已经积累了几年动物基因组的研究经验后,他开始对鸟类的演化树产生兴趣。“鸟类是一个非常独特的例子,研究了上百年,但生物演化的谱系是不清楚的。”
从厦门大学毕业后,张国捷进入中科院昆明动物研究所读研究生,在这个与华大基因联合培养的项目中,他开始了比较基因组学研究。这个发展不过十几年的新兴学科,是在基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化。
2005年,张国捷开始在华大基因的研究,从2008年起,他开始领导一个10人左右的课题组,开始做动物基因组的项目,包括蝙蝠、猕猴等。2010年,他提出了基于鸟类全基因组测序做物种演化研究的想法。
“当时他提出想做这样一个项目,领导也觉得这个研究方向会有一定的代表性。”华大基因新闻发言人杨碧澄对财新记者表示,当时领导认为,生物演化的研究方向有一定的代表性,会对这个学科的研究产生一个标杆式的示范性的效果。
从100万元启动经费开始,鸟类演化的研究开始启动。虽然已经有一些动物基因组研究的经验,但鸟类对于张国捷和他的团队来说都非常陌生。除了基因组学的研究,物种选取,样本搜集等工作还需鸟类方面的专家提供意见。
吉尔伯特和哈维斯的加入进一步地拓展了项目的视野和广度。他们两人中,一个在分子生物学方面颇有建树,一个是在鸟类鸣叫、脑神经发育等方面有深入研究的神经生物学家,并且在鸟类研究界有非常广的人脉。在对外公布这一项目后,项目组又先后收到世界各地做鸟类方面研究的科学家的加入申请。
基于这样的组织方式,慢慢有200多名研究者加入了联盟。“主要靠邮件,定期开电话会议。”项目成员之一,就职于华大基因的李彩告诉财新记者,最多的时候处于不同时差的二三十人同时在skype开会,讨论乱糟糟的,很久之后,才摸索出一套发言、讨论的规则。
随着基因组测序、分析等工作的深入,科学家们的集思广益也产生了更多的火花。例如,对于鸟类的性染色体研究、鸟类在进化中丢失基因的研究等等,都是在研究过程中发现的新的方向。
例如,鸟类的鸣唱学习的演化过程由美国杜克大学、西雅图艾伦脑科学研究所以及日本RIKEN脑科学研究所等机构协作完成;美国蒙特克莱尔州立大学和加州大学河滨分校的研究者贡献了鸟类演化中牙齿逐渐消失的研究;来自美国加州大学圣克鲁斯分校、得克萨斯理工大学和佛罗里达大学的学者们推断出了鸟类和鳄鱼的共同祖先的基因组序列。
而这一切都在基因组分析基础上完成,每个物种有约1.4万个同源基因,分析数据数千倍于之前相同研究所用到数据。庞大的计算任务使硬件要求面临巨大挑战,通过华大基因、慕尼黑超级计算中心、得克萨斯高级计算中心和圣地亚哥高级计算中心的几个超级计算中心进行并行计算才得以完成。
实际上,这样的运算成本非常昂贵。构建鸟类演化树大约花费了300年左右的CPU时间,这是一个巨大的计算挑战。其中一些分析甚至至少要求1TB内存的超级计算机。
经费从哪里来?2010年,张国捷团队的鸟类研究启动之时,曾经试图从国家自然科学基金委申请科研经费,却碰了一鼻子灰。虽然已经有一些优秀论文发表,但张国捷的资质在评审眼中显然不够,第一轮就被拒绝了。
华大基因当时也正进入一个重要的转折时刻,那一年,华大基因依靠国家开发银行贷款一举买下128台当时最先进的基因测序仪,开始将自己打造成世界测序工厂。
张国捷的研究因此近水楼台,全部48种鸟类的测序都依靠华大基因的资源免费完成,并且,项目的运作获得了华大基因无条件的支持。
回想起当年申请科研经费被拒的情况,张国捷并不觉得特别委屈,“他们是有一定标准的,我也确实不符合,我当时不是PI。”
在生物学界,成为一个“PI”(Principal Investigator),即研究室主任,是开展独立研究的先决条件。通常,一个博士生毕业之后经过几年的博士后训练,方有机会获得一个PI职位,申请到经费,建立起自己的实验室,开展研究。
张国捷坦陈,中国学者主导这样大型的国际科研合作还是第一次,许多经验都是摸索出来的,自己虽然没有依照传统学术体制的路数走过来,但在项目中协调世界各地的“PI”一同工作,其责任和能力的要求早已超出了一个“PI”。
这样的现象,也许只能在华大基因这样身份特殊的研究机构才能出现。
华大基因的年轻人
深圳盐田区的一栋并不起眼8层大楼曾是制鞋厂旧址。正值上班时分,一群群年轻男女从不远处的宿舍区走来。如果不是大楼上面“华大基因”的几个大字,也许路人会很容易认为这是一所大学上课之前的景象。
路边电线杆上招展的一面旗子上写着,“2013年中国科研机构第5”。这是指在英国自然出版集团发布的《2013年亚太地区自然出版指数》中,华大基因名列中国科研机构第5名,亚太地区科研机构第17名。
1999年以来,在生物学界四大名刊CNNS(Cell,Nature,New England Journal of Medicine,Science)上,华大基因署名发表文章共计165篇,高论文数量是华大基因的骄傲,但也是外界科学家诟病其“论文工厂”的来源。
根据华大基因的规定,员工不能穿正装上班,这些年轻人背着双肩包、穿着休闲服,在统一宽窄的工位上对着电脑屏幕。张国捷和他的团队,虽然是学术上的“明星”,也并无任何出挑之处,乍一看去,并不能分辨出他们是做市场、行政或是科研、技术。
学数学出身的28岁的李彩,已经在华大基因工作了五年,他穿着休闲装、运动鞋,带一点工科男特有的腼腆,但谈到鸟类研究的细节时话就多了起来。采访中,他侃侃而谈如何为华大基因培养新一批的科研人员,项目组更加年轻的同事在一旁笑称,他已经是个“leader”(带头人)。李彩说,在基因组学的研究领域,书本上的知识已远远落后前沿科技,在保证最基础的训练之外,最重要的是了解前沿文献、通过实践来提升自己。这也是许多在华大基因工作的年轻人的共识。
博士仍然在读的李彩已经在带领一个近10人的研究团队,在此次系列研究中的一篇重要论文中,他是共同第一作者。但他的“事迹”与北大肄业、24岁成为华大基因首席科学家的李英睿、19岁成为科研项目带头人的赵柏闻相比,似乎并不算什么。
快速地训练年轻人、集中力量攻克某一个问题、产出成果,似乎已经成为华大基因的人才培养模式。但张国捷指出,这种模式亦有自身的不足,这些学生在华大基因训练的几年之后,发展去向是一个问题,他认为,中国科研体制的改革,还是应该向成熟的欧美国家科研体制的方向学习。“无论在国内外,华大基因这样的机构都是一个‘异类’。”张国捷说。■
| 网页版
Copyright 财新网 All Rights Reserved
