当前位置: 树龙虾 >> 树龙虾的繁衍 >> 新研究提供迄今为止最详细的哺乳动物进化时
(图片来源:Pixabay/CC0PublicDomain)
年12月22日发表于《自然》(Nature)期刊上的一项新研究提供了迄今为止最详细的哺乳动物进化时间线。这项研究阐述了一种新颖且快速的计算方法,用于准确估算进化树(通常也叫做时间树)。该作者利用新方法分析了哺乳动物的基因组数据集,并回答了困扰现今胎盘类哺乳动物类群起源的大问题——白垩纪-早第三纪(K-Pg)的生物大灭绝事件使超过70%的物种彻底消失,其中包括了所有的恐龙,究竟该类群是起源于这场大灭绝事件之前还是之后?
此项研究结果的发现解决了现今哺乳动物起源的争议,证实了现今胎盘类哺乳动物的祖先在K-Pg生物大灭绝事件之后,即距今六千六百万年前出现。胎盘类哺乳动物是物种多样性最高的哺乳动物类群,其中包括有灵长类、啮齿类、鲸类、食肉类、翼手类(蝙蝠)以及人类。
该研究团队由伦敦大学玛丽女王学院的MariodosReis博士和英国布里斯托大学的PhilDonoghue教授带领,参与该项目的科学家分别来自于玛丽女王学院、布里斯托大学、伦敦大学学院、伦敦帝国理工学院和剑桥大学。
该篇文章的第一作者,伦敦大学学院的Sandralvarez-Carretero博士表示:“通过整合完整的全基因组数据和必要的化石信息,我们可以减少不确定性,并获得准确的进化时间线。当今的哺乳动物类群曾经和恐龙同时代共存过吗?亦或是在恐龙灭绝后哺乳动物才诞生的?现在我们对这些问题有了明确的答案。”
共同通讯作者Donoghue教授补充道:“哺乳动物进化的时间线在进化生物学中是最具争议的主题之一。早期研究估计现今胎盘类哺乳动物类群的起源时间在白垩纪的恐龙时代,但过去二十年的研究结果反复重蹈于K-Pg分化时间点的前后。而我们准确的时间线能解决此项争议。”
如今全球的测序项目持续产出着成百上千条基因组序列,且随时准备着对超过一百万个物种进行测序,进化生物学家将对这些信息触手可及。然而,现在的分析方法并不能高效地处理庞大的基因组数据集并生成进化时间线,且计算费昂贵。DosReis博士说:“推断进化时间线是生物学的基本目标,然而如今最先进的分析方法依赖于计算机去模拟并推导出最可信的进化时间线。在我们的实验结果中,这确实异常难于实现,因为数据集过于庞大,涉及了近五千种哺乳动物的数据,其中包含了72个完整的基因组信息。”
在这项研究中,研究人员开发了一种全新的、快速的、基于贝叶斯的方法来分析大量的基因组序列,同时也考虑了数据中的不确定性因素。dosReis博士说道:“我们通过分步法将复杂的计算划分成多个步骤来解决:首先使用72个基因组数据来模拟时间线,将此时间线作为引导的工具,指示其他物种时间线的模拟。同时我们可以利用基因组信息来减少不确定性,因为它可以移去模拟结果中不可行的时间线。”
本篇文章的共同第一作者,伦敦大学学院的AsifTamuri博士,同时也是哺乳类动物基因组数据集组装的负责人补充道:“我们的数据处理流程收集了尽可能多的哺乳类动物基因组数据集。而这也是个严峻的挑战,因为一般的基因数据库的数据鱼龙混杂,并不准确,因此我们必须开发一个可识别并排除低质量样品或错误标记数据的方法。”
对于复杂数据的分析,该团队利用此方法能够将计算时间从原本的几十年减少至几个月。lvarez-Carretero博士说:“如果我们试图用超算去分析如此庞大的哺乳类动物数据集,而不用新开发的贝叶斯方法的话,那么我们需要耗费几十年的时间去推断时间树。不妨想象一下,如果我们用自己的电脑去做此类分析的话将会耗费多长时间。”lvarez-Carretero博士继续补充道:“另外,我们设法将计算时间减少了倍。这个新方法不仅仅能分析基因组数据,还能够有效地、大幅度地减少了二氧化碳的排放,因为从本质上讲,由于计算产生的运算时间减少了。”
(图片来源:CC0PublicDomain)
该研究开发的方法能够用来解决其他大型数据集的分析,如在进化时间线上具有争议的问题。通过将以贝叶斯为基础的新方法,与达尔文生命树和地球生物基因组项目中即将获得的基因组数据相结合,估算可靠的生命树进化时间尺度的想法现在似乎变得触手可及。
查尔斯·达尔文年的《物种起源》中唯一的插图,展示了物种的分化。(图片来源:维基百科)
翻译:黄俊满
审校:赵冰莹
引进来源:伦敦大学玛丽女王学院(QueenMary,UniversityofLondon)
本文来自:中国数字科技馆