5月10日,国际学术刊物《自然》发表了人类泛基因组参考序列的阶段性成果,在与之相关的3篇论文当中,人类泛基因组参考联盟提出了首个人类泛基因组参考草图,以及两个以这一参考图为基础的新遗传学研究发现。
自20世纪末启动以来,人类基因组测序一直是国际遗传学界最关注的工程之一。人类基因组计划中国项目负责人、中科院院士杨焕明曾说,人类基因组计划之所以引人注目,首先源于人们对健康的需求。如果能够解码纷繁复杂的DNA序列,人类对于演化、医疗的理解将更上一层楼。人类基因组因此有了“生命天书”的称号。
2001年2月12日,国际人类基因组计划首次公布人类基因组图谱及初步分析结果;2003年4月15日,人类基因组序列草图正式公布。在之后的20年中,人类基因组测序工作持续推进,并不断取得阶段性成果。其中一些意义比较重大的阶段性成果,被人们称为“里程碑”。
今年5月新发布的首个人类泛基因组参考草图也是这样的“里程碑”成果。深圳华大生命科学研究院副院长金鑫解读说,这一成果的重大意义体现在“泛”字当中——这份“泛”草图意味着空前的多样性,比起原先的参考基因组序列,它具有更好的全球代表性。
生命科学的“登月计划”只是起点
基因组测序是遗传学界的一个重要研究方向,众多科研团队围绕不同目标制订了许多测序计划,其中最核心的是国际人类基因组计划,该计划于2001年2月12日首次公布了人类基因组图谱及初步分析结果。
人类基因组计划是一项规模宏大的跨国科学工程,旨在测定组成人类染色体的30亿个碱基对的核苷酸序列,从而绘制人类基因组图谱,并辨识其载有的基因及其序列,达到破译人类遗传信息的最终目的。
该计划于1985年提出,来自美、英、法、德、日和中国六国的2000多名科学家共同参与了这一浩大工程,在测序技术尚且不发达的情况下,科学家历时十余年发表了人类基因组工作草图。
“可以说,人类参考基因组是生命科学领域最重要的‘基础设施’之一,许多生物学和医学领域的突破性研究都基于此产生。”金鑫说。
但是,这份“千呼万唤始出来”的工作草图依然缺失大量难以测定的片段,准确性也受限于时代条件。因此,在之后的20余年中,这份图谱经历了数次重大“升级”。
2003年4月15日,人类基因组序列草图正式公布。2013年,参考基因组序列(GRCh38)正式发布。2022年4月,第一个完整的、无间隙的人类基因组序列问世,标志着人类“生命天书”首次被完整写成。
人类基因组计划与“曼哈顿原子弹计划”和“阿波罗计划”并称为三大科学计划,被誉为生命科学领域的“登月计划”——人类基因组工作草图的完成就像是人类初次登上月球,取得这一成就需要大量付出,但它依然只是科学探索的起点而非终点。
金鑫表示,人类参考基因组就像是大树的主干,是一切后续研究的基础,但它并不完美,依然存在局限性。科学家围绕这一主干开展了许多“添枝加叶”的工作,泛基因组就是其中之一。
泛基因组样本扩大
人类参考基因组是人类遗传学中使用最广泛的资源。但是,它目前的结构是20多人基因的合并单倍型的线性组合,其中,来自欧洲人种的单个个体提供了大部分序列。
尽管全世界人类的绝大多数遗传物质都是相同的,只有少数基因决定了个体差异,但是相对单一的样本意味着人们依然对这些创造差异的基因缺乏洞察,因此现有的人类参考基因组无法完全代表全球人类。
此外,由于人类基因当中存在结构变异和替代等位基因,人类参考基因组更加无法涵盖人类物种的遗传多样性。金鑫把人类参考基因组的局限性归纳为两方面,一是完整性不足,二是代表性不足。2022年,完整无间隙基因组序列的诞生很大程度上改善了完整性不足的问题,但是参考基因组的代表性仍未得到充分提高。
为了让基因测序具有全球代表性,人类泛基因组参考联盟应运而生,这个组织的宗旨是构建高质量的人类参考基因组。目前,人类泛基因组参考联盟的目标是以350人的样本为基础,创建一个质量高、完整度高、准确度高的基因组,这350人来自世界各地,可以代表人类95%以上的遗传多样性。
今年5月发布的新研究进展就是这一计划的阶段性成果。目前,研究者组合了47个个体的遗传物质,为原有的参考人类基因组(GRCh38)添加了1.19亿碱基对和1115个基因重复。
“相对于主要基于欧洲人种遗传物质建立的参考基因组,泛基因组把样本扩大到了来自世界各地的人类个体,具有更好的全球代表性。对于欧美白人以外的广大人群,这项工作的意义举足轻重。”金鑫说。
将更好为人类健康服务
相比人类参考基因组,5月新发布的泛基因组检测到结构变异的数量增加了104%,相对之前翻了一番,这一数字不仅代表着庞大的数量,还意味着拯救更多生命的可能性。此外,目前的成果还只是人类泛基因组研究的一个阶段性收获,如前文所述,研究目标是对350人的遗传物质进行测序,但截至目前仅完成了47人。
2010年,6岁的美国男孩尼古拉斯·沃尔克成为世界上第一个被基因测序技术拯救的儿童。这个男孩患上了严重的肠道感染病,经历了约百次手术但病因依然无法确定。最终,医生们通过基因测序,发现沃尔克的疾病来自一个罕见的基因突变。在此基础上,沃尔克接受了脐带血细胞移植后终于痊愈。
除了沃尔克,世界上还有多例被基因技术治愈的病例,人类参考基因组是这些病人得到准确诊断的重要基础之一。泛基因组测量出来的结构变异不仅使人们对人类基因组遗传多样性的理解更加完整,还让更多患者得到了诊断和治疗的可能性。
来自美国加利福尼亚大学圣迭戈分校的研究者指出,基于这些成果,人们将更容易确定促成生理特征或临床特征变异的遗传因素,并在此基础上造福更多人。
“人类泛基因组的研究进展有助于促进全球医疗公平。泛基因组吸纳了更多不发达地区人类个体的样本,这意味着它比参考基因组更适用于研究和辅助应对这些人群的疾病。”金鑫说。
金鑫还强调,泛基因组研究能实现不同人群的遗传信息对照,这会让所有参与计划的人群都从中受益。
金鑫所在的深圳华大生命科学研究院曾与多国科学家共同发起国际千人基因组计划,这一计划与泛基因组计划类似,目标都是在参考基因组的基础上创建一个全球代表性更好的人类基因组图谱。
“中国是个有14亿人口的大国,中国人的遗传多样性十分丰富。中国学者同样致力于建立代表性更强、更多样化的基因组,为我国乃至世界的基因研究与医疗公平作出贡献。目前我国科学界已有不少相关成果发表,预计近期还会有一系列重要成果问世。”金鑫透露。