人类基因组计划的核心是一个巨大的问题

Happy carnival in Hong Kong(é¦™æ¸¯è‰æ ¹éšŽå±¤å"±è·³å‡ºå¿«æ¨‚äººç"Ÿç¬¬ä¸€è¼¯)

人类基因组计划始于20世纪90年代智人（Homo sapiens） '成功地尝试绘制出我们物种的全部DNA。它产生了人类参考基因组，这是一个精细抛光的人类DNA集合，对世界各地的遗传学研究和遗传学测试服务至关重要。约翰斯·霍普金斯大学（Johns Hopkins University）的两名研究人员已经发现，参考基因组缺失了一两个基因，确切地说是296,485,284个碱基对DNA。

参考基因组是人类遗传物质的基本图谱，用作比较的基础。当我们对自己的DNA进行测序以了解健康，家族史和未来的疾病风险时，我们将序列切割成许多小块，并将其与参考基因组进行比较，寻找我们不同的区域。科学家在最近的一篇论文中写到了这个问题的根本问题自然遗传学，参考基因组主要基于一个人。考虑到今天活着的77亿人之间存在着无数的遗传差异，这显然并不理想。

计算机科学与生物统计学教授Steven Salzberg博士和Rachel Sherman博士。候选人，假设这个单一参考基因组不能捕捉人类遗传学的多样性。他们补充说，有些人群不同太多了来自这个参考基因组。为了说明这一点，他们提到了来自20个不同国家的910个人的基因组，这些人都是泛非洲裔。

在这些个体的DNA中，研究小组发现了我们的“参考”基因组中不存在的3亿个常见DNA片段。萨尔茨伯格说，如果我们忽视这么多材料，我们就不可避免地会错过对特定人群健康和历史的重要见解。它们也是人类，所以它们不应该代表“人类”参考基因组吗？

“这些区域对于遗传学界来说基本上是不可见的，直到我们有一个包含这些区域的参考基因组，”Salzberg说逆。

参考基因组的问题。

多年来，我们不断研究参考基因组。但最近的分析表明差不多百分之七十萨尔茨堡解释说，它的材料来自一个非洲裔美国人，他只被称为RPCI-11。

这意味着当科学家进行遗传分析以识别来自世界各地的不同种群之间的差异时，大多数时候，他们将这些基因组与来自大多数人的遗传物质进行比较。谢尔曼说，这导致我们经常忽略可能与此参考文献太不同的材料。她称他们为“缺件”。

“当你排队时，会有一些根本没有排列的碎片，因为它们与参考基因组中的任何东西都不相符。”谢尔曼说。 “然后你忽略了所有没有排列的东西，因为它们不是真正相关或者不值得一看，实际上这些东西实际上是最感兴趣的部分，因为它们与参考基因组最不同。”

在这项研究中，谢尔曼和萨尔茨伯格采取了大量的这种“不同”材料（大约1000个碱基对长），并试图确定它们是否仅代表偶然的测序错误串 - 或者确实掌握了有关未开发人类DNA的有用信息。

该团队得出的结论是，这种“新”DNA具有足够高的质量，可以保证第二次通过，即使他们不知道它对人体的重要性是什么。

后果是什么？

到目前为止，谢尔曼说，我们不知道我们错过了什么，忽略了参考基因组中没有代表的DNA。但谁知道如果我们看看我们会在那里找到什么？

萨尔茨伯格建议我们想象一个虚构的人口有一个额外的染色体 - 24而不是每个细胞中通常的23。来自该群体的额外染色体中的任何内容都不会与参考基因组对齐。也许，她说，在隐藏的染色体上的某个地方，是虚构人群倾向于发展某种疾病的原因 - 以及为什么世界其他地方没有。但是因为我们没有正确的参考来比较它，我们永远不会知道它在那里。

引入人类基因组计划捐赠者的原始广告（布法罗新闻，1997年3月23日），h / t Pieter de Jong，他放置了广告pic.twitter.com/gNB7mMv3Yu
- Jay Shendure（@JShendure）2017年10月28日

萨尔茨伯格说：“如果有一段时间，那条染色体上的突变确实会引起问题，那么你就永远无法研究它们了。” “如果你完全依赖这个参考基因组，你就永远无法观察它们。”

让我们明确一点：这项研究没有提供一些未被发现的染色体的证据。但它确实表明，当我们使用一个名为RPCI-11的人的单一参考基因组作为我们对整个物种DNA的所有分析的基础时，我们可能会遗漏很多。

我们如何解决这个问题？

该团队争辩说，我们不应该争取单一的通用参考基因组，而应该有一个束参考基因组 - 可能是每个感兴趣的人群之一。

“我们在这里提倡的是，我们真的需要为每个人群建立参考基因组，”谢尔曼说。 “如果这个群体中的参考文献中缺少这么多的DNA，模型就需要改变。”

一些国家已经采取了自己至少尝试创建自己的参考基因组。例如，丹麦正在编制150个丹麦人的遗传物质，试图建立一个真正的“丹麦”参考基因组。 2016年的一篇论文性质描述了为韩国人编制参考文献的尝试，尽管该文章也只描述了对一个人进行的研究。但其他项目，如1000 Genomes Project，也试图开始这个过程，但是创建一个像当前版本GR438一样精美的参考资料需要做很多工作。

“你必须做的不仅仅是从其他人群中排序另一个人以创建参考基因组，”他补充道。 “你必须做更多的事情。”

并不是研究人员不知道我们需要更多的参考基因组。 Salzberg只是希望到现在它们会有更多，并且它们至少被广泛采用作为标准参考基因组。该报告称，这些尝试都没有达到与GRCh38相同的地位和影响力 - 尽管这是丹麦项目的目标。

展望未来，Sherman和Salzberg正在通过建立几个额外的参考基因组来开始这个项目，他们希望在一到两年内发布。他们希望开始创建一个参考基因组库，以帮助人们从遗传物质中获得尽可能多的洞察力，无论它们有多么“不同”。

“我们真正需要的是数百个参考基因组，”他补充道。 “那将在某一天发生。”

$config[ads_kvadrat] not found

人类基因组计划的核心是一个巨大的问题

Happy carnival in Hong Kong(é¦™æ¸¯è‰æ ¹éšŽå±¤å"±è·³å‡ºå¿«æ¨‚äººç"Ÿç¬¬ä¸€è¼¯)

目录:

参考基因组的问题。

后果是什么？

我们如何解决这个问题？

Happy carnival in Hong Kong(é¦™æ¸¯è‰æ ¹éšŽå±¤å"±è·³å‡ºå¿«æ¨‚äººç"Ÿç¬¬ä¸€è¼¯)