扫一扫下载界面新闻APP

人类基因组图谱并不完整,据此进行的基因研究可能存在重大疏漏

在人类参考基因组里,人类的很多遗传信息其实并没有得到反映。

存放于伦敦韦尔科姆收藏馆Medicine Now展厅的第一套人类基因组图谱丛书

来源:Arstechnica

翻译:于波

2001年,人类基因组图谱及初步分析结果首次公布。最新版的人类基因组图谱名为GRCh38,包含3.1兆亿碱基对的信息。

然而,这个被誉为生命科学“登月计划”的研究项目漏掉了一些重要信息。近日发表于《自然遗传学》杂志的一篇文章指出,参考基因组缺失了多达10%的遗传信息。这些缺失的信息被发现存在于许多非洲人后裔,以及其他人类群体身上。

参考基因组

“人类基因组”实际上只包含了少数人的基因组。GRCh38的大部分信息只来自于同一个人。与其说这是人类DNA的快照,不如说是一种模板和路线图,可以让人们有一个大致的概念,并在个人基因组与“参考基因组”之间进行比较。

我们知道,参考基因组有其局限性,科学家也一直在对其加以补充完善,以便更好地体现当今人类身上发生的大量变异。然而,上述文章的作者们指出,由于来源有限,参考基因组的用处其实也是有限的。“近些年,越来越多的研究人员开始强调获取和体现不同人群测序数据的重要性。”

上述文章的作者们认为,在目前的情况下,要分析那些血统大大不同于参考基因组血统的人,是一个十分棘手的难题。虽然有些方法可以让研究人员获得数量有限的遗传多样性数据,但更加全面、日益流行的一个方案,是建立面向特定人群的参考基因组。这一项目已经在进行当中,对象包括中国人和德系犹太人。

全人类基因组

上述文章的第一作者蕾切尔·舍曼(Rachel Sherman)表示,目前没有“泛基因组”,也就是说,没有“体现(某)种群所有DNA的基因组图谱”。细菌有,但人类还没有。所以,他们打算利用910名非洲后裔的DNA,建立非洲人的泛基因组。这些非洲后裔包括加勒比海人和美国人,他们身上保留了一部分的非洲遗传多样性,也拥有各自不同的遗传历史。

研究人员将这些人的DNA与参考基因组进行比较,寻找不匹配的长序列。DNA的基本单位是碱基对,也就是双螺旋梯子上的一级阶梯。舍曼和同事试图寻找长度超过1000个碱基对、与参考基因组不匹配的序列,结果发现了近3亿个碱基对,大约相当于整个参考基因组的10%。

这并不是说,那些信息为非洲人所独有(其中大约40%的数据与韩国人或中国人的基因组相符),而是说,它们也是重要的遗传信息,虽然在人类身上广泛出现,但没有涵盖在人类参考基因组里,因为后者只根据少数人的DNA编纂而成。因此,在人类参考基因组里,人类的很多遗传信息其实并没有得到反映。

医学意义及警示

任何研究,如果依靠参考基因组来分析人类基因变异的话,无疑都会错过这些重要数据。

舍曼及其同事表示:“现在,几乎所有研究都是根据参考基因组来分析基因变异。就基于人群的人类遗传学研究而言,单一的参考基因组是不够的。”他们还指出,解决办法之一是,为不同人群建立参考基因组。随着时间的推移,“包含人类所有DNA”的泛基因组最终将会产生。

这对医学具有重大意义。舍曼称,“如果你是科学家,你寻找的基因变异与某一人群更容易患的某种疾病有关,那么,你会想要将他们的基因组与更能代表那个人群的参考基因组进行对比。”

不过,即便掌握了非洲人的这些遗传信息,我们目前也并不清楚,研究特定疾病的科学家可以用这些信息来做些什么。而对于参考基因组未包含的DNA的作用,以及它们在健康或其他基因变异方面扮演的角色,舍曼团队并没有进行研究。

面向特定人群的参考基因组也许有助于研究人类的基因变异,但在实验室之外的现实世界,则可能遇到另外一些困难。非洲人的遗传信息中,有很多也出现在韩国人身上,这说明不同人群之间并没有清晰的界线,尤其是在DNA层面上。事实上,界线是非常模糊的;个体能同时拥有多个人群的遗传特征,一个人的外表并不是其DNA的可靠体现。

让情况更复杂的是,非洲内部有多个人群,这些人群拥有不同的遗传历史,而我们对此只是略知皮毛而已。拥有泛非洲基因组,未必能让我们对非洲人个体之间的差异有更加深入的了解。

虽然遗传学研究人员都清楚这一点,但如果大众对此缺乏良好的沟通和了解,那么,面向特定人群的参考基因组在医学等领域的应用,也可能面临一系列新的问题。

未经正式授权严禁转载本文,侵权必究。
表情
您至少需输入5个字

评论 0

相关文章

推荐阅读