今天发表在《自然》杂志上的一项新研究提供了迄今为止哺乳动物进化的最详细时间表。
该研究描述了一种新的快速计算方法来获得精确日期的进化树,称为“时间树”。作者使用这种新方法分析了哺乳动物基因组数据集,并回答了一个长期存在的问题,即现代胎盘哺乳动物群体是起源于白垩纪-古近纪 (K-Pg)大灭绝之前还是之后,灭绝了超过 70% 的所有物种,包括所有恐龙。
这些发现证实了现代胎盘哺乳动物群体的祖先发生在 6600 万年前的 K-Pg 灭绝之后,解决了关于现代哺乳动物起源的争议。胎盘哺乳动物是现存哺乳动物中最多样化的群体,包括灵长类动物、啮齿动物、鲸目动物、食肉动物、手足目(蝙蝠)以及人类。
研究团队由Mario dos Reis博士(伦敦玛丽女王大学)和Phil Donoghue教授(布里斯托大学)领导,包括来自玛丽女王、布里斯托尔大学、伦敦大学学院、伦敦帝国理工学院和剑桥大学的科学家.
来自伦敦大学学院(当时在玛丽皇后学院)论文的第一作者 Sandra Álvarez-Carretero 博士说:“通过在分析中整合完整的基因组和必要的化石信息,我们能够减少不确定性并获得精确的进化时间表。现代哺乳动物群是与恐龙共存,还是起源于大灭绝之后?我们现在有了明确的答案。”
“哺乳动物进化的时间线可能是进化生物学中最具争议的话题之一。早期的研究提供了恐龙时代白垩纪深处现代胎盘群的起源估计。过去的二十年里,研究在后- 和 pre-K-Pg 多样化方案。我们的精确时间表解决了这个问题。” 该论文的共同高级作者 Donoghue 教授补充道。
随着全球测序项目现在产生成百上千个基因组序列,并且迫在眉睫的计划是对超过一百万个物种进行测序,进化生物学家很快就会掌握大量信息。然而,目前分析大量可用基因组数据集并创建进化时间表的方法效率低下且计算成本高。
“推断进化时间线是生物学的一个基本目标。然而,最先进的方法依赖于使用计算机来模拟进化时间线并评估最合理的时间线。在我们的案例中,由于分析了巨大的数据集,这很困难,涉及来自近 5,000 个哺乳动物物种和 72 个完整基因组的遗传数据,”dos Reis 博士说。
在这项研究中,研究人员开发了一种新的、快速的贝叶斯方法来分析大量基因组序列,同时还考虑了数据中的不确定性。“我们通过将分析分成子步骤解决了计算障碍:首先使用 72 个基因组模拟时间线,然后使用结果指导对其余物种的模拟。使用基因组减少了不确定性,因为它允许从模拟中拒绝不合理的时间线,”dos Reis 博士说。
“我们的数据处理管道为尽可能多的哺乳动物物种获取了尽可能多的基因组数据。这是具有挑战性的,因为遗传数据库包含不准确之处,我们必须制定一种策略来识别必须删除的劣质样本或错误标记的数据,”博士补充道。 . Asif Tamuri,UCL 论文的共同主要作者,负责组装哺乳动物基因组数据集。
使用他们的新颖方法,该团队能够将这种复杂分析的计算时间从几十年减少到几个月。“如果我们试图在不使用我们开发的贝叶斯方法的情况下在超级计算机中分析这个大型哺乳动物数据集,我们将不得不等待几十年才能推断出哺乳动物的时间树。想象一下,如果我们使用我们的分析方法需要多长时间?自己的 PC,”Álvarez-Carretero 博士说。“此外,我们设法将计算时间减少了 100 倍。这种新方法不仅允许分析基因组数据集,而且通过提高效率,大大减少了由于计算而释放的 CO 2排放量,”博士说。阿尔瓦雷斯-卡雷特罗继续。
该研究中开发的方法可用于处理其他需要分析大型数据集的有争议的进化时间线。通过将新颖的贝叶斯方法与达尔文生命之树和地球生物基因组项目即将推出的基因组相结合,估计生命之树可靠进化时间尺度的想法现在似乎触手可及。