非营利非商业性健康信息的可信来源
美国抗衰老、预防和再生医学学会的原始声音
标志 标志
遗传研究

研究人员创造了最大的人类家谱:2700万祖先

9个月3周前

7543 0
发布于2022年3月7日下午4点

牛津大学大数据研究所(BDI)的研究人员在绘制人类遗传关系的整体图谱方面迈出了重要一步:一个可以追溯我们所有人祖先的单一系谱。这项研究已发表在科学

在过去的20年里,人类基因研究取得了非凡的进步,产生了数十万人的基因组数据,其中包括数千名史前人类。这为追踪人类基因多样性的起源提供了令人兴奋的可能性,从而绘制出一幅完整的地图,展示世界各地的个体之间是如何相互关联的。

到目前为止,这一愿景面临的主要挑战是找到一种方法,将来自许多不同数据库的基因组序列结合起来,并开发出处理这种规模数据的算法。然而,牛津大学大数据研究所的研究人员今天发表的一种新方法可以轻松地组合来自多个来源的数据,并扩展到容纳数百万个基因组序列。

大数据研究所的进化遗传学家、主要作者之一黄燕博士解释说:“我们基本上已经建立了一个巨大的家谱,一个所有人类的谱系,尽可能准确地模拟了产生我们今天在人类身上发现的所有遗传变异的历史。这种系谱可以让我们看到每个人的基因序列是如何与其他每个人的基因序列相关联的,沿着基因组的所有点。”

由于单个基因组区域只能从父母一方遗传,要么是母亲,要么是父亲,基因组上每个点的祖先可以被认为是一棵树。这组树被称为“树序列”或“祖先重组图”,它将遗传区域与遗传变异首次出现的祖先联系起来。

主要作者安东尼·怀尔德·沃恩斯博士在大数据研究所攻读博士学位时进行了这项研究,现在是麻省理工学院和哈佛大学布罗德研究所的博士后研究员。他说:“从本质上讲,我们正在重建祖先的基因组,并利用它们形成一个巨大的人际关系网络。然后我们就可以估计出这些祖先生活的时间和地点。我们的方法的强大之处在于,它对基础数据的假设非常少,而且还可以包括现代和古代的DNA样本。”

这项研究整合了来自8个不同数据库的现代和古代人类基因组数据,包括来自215个种群的3609个个体基因组序列。古代基因组包括在世界各地发现的样本,年龄从1000年到10万多年不等。该算法预测了进化树中共同祖先必须出现的位置,以解释遗传变异的模式。由此产生的网络包含了近2700万个祖先。

在这些样本基因组上添加位置数据后,作者使用网络来估计预测的共同祖先生活的地方。研究结果成功地重现了人类进化史上的关键事件,包括走出非洲。

虽然族谱图已经是一个非常丰富的资源,但研究团队计划通过继续纳入现有的遗传数据,使其更加全面。由于树序列以高效的方式存储数据,数据集可以轻松容纳数百万个额外的基因组。

黄博士说:“这项研究为下一代DNA测序奠定了基础。随着来自现代和古代DNA样本的基因组序列质量的提高,这些树将变得更加准确,我们最终将能够生成一个单一的、统一的地图,解释我们今天看到的所有人类遗传变异的下降。”

沃恩斯博士补充说:“虽然人类是这项研究的重点,但这种方法适用于大多数生物;从猩猩到细菌。这对医学遗传学尤其有益,可以从我们共同的祖先历史中产生的虚假联系中分离出遗传区域和疾病之间的真实联系。”

相关视频:https://vimeo.com/678821780

*丹尼索瓦人是一种已灭绝的人类,与尼安德特人有远亲关系。他们被认为从大约40万年前到大约4万年前生活在西伯利亚和东亚。

**这项研究是BDI和牛津大学的合作;美国麻省理工学院和哈佛大学布罗德研究所;美国哈佛大学和奥地利维也纳大学。

就像你在网上读到的任何东西一样,这篇文章不应该被理解为医学建议;在改变你的健康计划之前,请咨询你的医生或初级保健提供者。

内容可以根据风格和长度进行编辑。

提供的资料:

https://www.bdi.ox.ac.uk/news/bdi-researchers-create-largest-ever-human-family-tree

https://www.ox.ac.uk/

http://dx.doi.org/10.1126/science.abi8264

https://vimeo.com/678821780



世界卫生视频

Baidu