投稿|Science封面:20年后,人类基因组计划终于完整了

投稿|Science封面:20年后,人类基因组计划终于完整了
文章图片

图片来源@视觉中国

文 | 学术头条
本周五,最新一期 Science 杂志同时发表了六篇文章,并以封面形式介绍了人类基因组计划的最新成果 。这也是时隔二十多年后,人类基因组计划的全新里程碑:一份更完整的人类基因组 。
二十多年前完成的人类基因组计划,其实遗漏了大约 8%的 DNA 序列 。这些遗漏的部分,主要是 DNA 序列高度重复的染色体中间部分的着丝粒、末端的端粒(在很大程度上之前被视为垃圾) 。二十多年来,研究人员认为,这些区域可能在进化和疾病中发挥关键作用 。
在这次发表的最新成果中,由大约 100 名科学家组成的团队首次完成了对整个人类基因组的完整测序,并将完整结果发表在 Science 杂志上 。
投稿|Science封面:20年后,人类基因组计划终于完整了
文章图片

研究人员表示,完成完整的人类基因组测序是一项重要科学成就,为了解人类 DNA 提供了首个全面视角 。这些最基本的信息将增进对人类基因组所有细微功能差别的了解,促进对人类疾病的基因研究 。
生命科学的“登月计划”人类基因组计划(Human Genome Project, HGP)是一项规模宏大,跨国跨学科的科学探索工程 。其宗旨在于测定组成人类染色体(指单倍体)中所包含的 30 亿个碱基对组成的核苷酸序列,从而绘制人类基因组图谱,并且辨识其载有的基因及其序列,达到破译人类遗传信息的最终目的 。
人类基因组计划由美国科学家于 1985 年率先提出,于 1990 年正式启动的 。美国、英国、法国、德国、日本和我国科学家共同参与了这一预算达 30 亿美元的人类基因组计划 。截止到 2003 年 4 月 14 日,人类基因组计划的测序工作已经完成 。其中,2001 年人类基因组工作草图的发表被认为是人类基因组计划成功的里程碑 。
人类基因组计划与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划,是人类科学史上的又一个伟大工程,被誉为生命科学的“登月计划” 。
人类基因组分布在 23 对染色体中,由超过 60 亿个单独的 DNA 碱基组成,与黑猩猩等其他灵长类动物的数量大致相同 。为了读取基因组,科学家首先将所有 DNA 切成数百到数千个字母长的片段,然后测序机器读取每个片段中的单个字母,然后再试图以正确的顺序组装这些字母,就像拼一个复杂的拼图一样 。
但是,这里面的一个挑战是基因组的某些区域一遍又一遍地重复相同的字母 。重复区域包括着丝粒,这是将两条染色体连接在一起并在细胞分裂中起关键作用的部分,以及为细胞蛋白质工厂提供指令的核糖体 DNA 。还有其他重复部分包括可能帮助物种适应环境的新基因 。
正是由于这些DNA的重复,使得在人类基因组测序时无法以正确的顺序组装一些 DNA 片段 。另一个障碍是,大多数细胞包含两个基因组——一个来自父亲,一个来自母亲 。当研究人员试图组装所有片段时,来自每个亲本的序列可能混合在一起,从而掩盖了每个单独基因组中的实际变异 。
虽然人类基因组计划在 2003 年取得了巨大成功,但实际上,离最终的胜利还差一点点 。由超过 8% 的基因组并没有被解读,这些缺失的部分包含高度重复的序列,并在很大程度上被视为“垃圾” 。

推荐阅读