科学家终于完成了对整个人类基因组的解码

科技 编辑精选

题图:这张由国家人类基因组研究所提供的未注明日期的图像显示了 DNA 测序仪的输出。(来源:美联社)

【澳纽网编译】科学家们说,他们终于组装了完整的人类生命基因蓝图,将缺失的部分添加到了一个几乎在 20 年前完成的谜题中。

一个国际团队在周五发表在《科学》杂志上的研究中描述了对完整人类基因组的首次测序——一套建立和维持人类的指令。之前在世界范围内庆祝的努力是不完整的,因为当时的 DNA 测序技术无法读取其中的某些部分。即使在更新之后,它仍然丢失了大约 8% 的基因组。



“一些使我们成为独一无二的人类的基因实际上存在于这个‘基因组的暗物质’中,它们完全被遗漏了,”华盛顿大学研究员 Evan Eichler 说,他参与了当前的努力和最初的人类基因组计划。“花了 20 多年的时间,但我们终于完成了。”

许多人——包括艾希勒自己的学生——认为它已经完成了。“我在教他们,他们说,‘等一下。这不是你们第六次宣布胜利吗?我说,‘不,这次我们真的,真的做到了!

科学家们表示,这幅完整的基因组图将使人类更深入地了解我们的进化和生物学,同时也为在衰老、神经退行性疾病、癌症和心脏病等领域的医学发现打开大门。

“我们只是扩大了了解人类疾病的机会,”周五发表的六项研究之一的作者凯伦米加说。

这项研究结束了几十年的工作。人类基因组的初稿在 2000 年的白宫仪式上由两个相互竞争的实体的领导人宣布:一个由美国国立卫生研究院的一个机构领导的国际公共资助项目和一家位于马里兰州的私人公司 Celera Genomics。

人类基因组由大约 31 亿个 DNA 亚基组成,它们是由字母 A、C、G 和 T 已知的化学碱基对。基因是这些字母对的字符串,其中包含制造蛋白质的指令,蛋白质是生命的组成部分。人类有大约 30,000 个基因,分为 23 个组,称为染色体,存在于每个细胞的细胞核中。

在此之前,“我们的地图中一直存在巨大而持久的差距,这些差距落在非常重要的区域,”米加说。



加州大学圣克鲁兹分校的基因组学研究员 Miga 与国家人类基因组研究所的 Adam Phillippy 合作,组织科学家团队从头开始研究一个新的基因组,目的是对所有基因组进行测序,包括以前丢失的部分。该组以染色体末端的部分命名,称为端粒,被称为端粒到端粒或 T2T 联盟。

他们的工作为人类基因组增加了新的遗传信息,纠正了以前的错误,并揭示了已知在进化和疾病中发挥重要作用的长链 DNA。该研究的一个版本于去年发表,然后由科学同行审查。

“我想说,这是人类基因组计划的重大改进,”圣路易斯华盛顿大学医学院的遗传学家 Ting Wang 说,它的影响翻了一番,他没有参与这项研究。

艾希勒说,一些科学家过去认为未知区域包含“垃圾”。不是他。“我们中的一些人一直相信那些山上有黄金,”他说。艾希勒由霍华德休斯医学研究所支付,该研究所也支持美联社的健康和科学部。

他说,事实证明黄金包含许多重要基因,例如使人的大脑比黑猩猩更大的基因,具有更多的神经元和连接。

为了找到这样的基因,科学家们需要新的方法来解读生命神秘的遗传语言。

读取基因需要将 DNA 链切割成数百到数千个字母长的片段。测序机器读取每件作品中的字母,科学家们试图将这些作品按正确的顺序排列。这在字母重复的区域尤其困难。

科学家们表示,在基因测序机器得到改进之前,有些区域难以辨认,例如,现在它们可以一次准确地读取一百万个 DNA 字母。这使科学家能够将具有重复区域的基因视为更长的字符串,而不是他们后来必须拼凑的片段。

研究人员还必须克服另一个挑战:大多数细胞都包含来自母亲和父亲的基因组,这使正确组装这些片段的尝试变得混乱。T2T 研究人员通过使用来自一个“完全葡萄胎”的细胞系解决了这个问题,这是一种不包含胎儿组织的异常受精卵,它有两个父亲的 DNA 拷贝,而没有母亲的 DNA。

下一步?绘制更多基因组图谱,包括包含父母双方基因集合的基因组。这项工作没有绘制出男性中发现的 23 条染色体中的一条,称为 Y 染色体,因为痣只包含一个 X。

王说,他正在与人类泛基因组参考联盟的 T2T 小组合作,该联盟正试图为代表人类多样性广度的 350 人生成“参考”或模板基因组。

“现在我们已经得到了一个正确的基因组,我们必须做很多很多,”艾希勒说。“这是人类遗传学领域真正奇妙的开始。”

来源:美联社 原文链接



 2,154 views