沈涵 科技日报记者 王春
11月19日晚,国际人类表型组研究协作组(IHPC)第三次理事会在线召开。来自19个国家21位协作组理事和多位表型组学领域的一流科学家出席了此次会议,就下一步加快推进人类表型组国际大科学计划的重要事项展开国际协商和深入探讨。
据悉,表型是生命体的生物特征,由基因(内因)与环境(外因、含环境暴露和生活方式)共同决定;表型组是指生物体从微观(即分子)组成到宏观、从胚胎发育到衰老死亡全过程中所有表型的集合。人类表型组计划就是要基于“测一切之可测”的理念,对人类的各种表型进行全尺度、全周期精密系统测量,从而解析基因-表型-环境之间以及宏观-微观表型之间的关联,进一步破解各种表型和人类健康与疾病的关系。因此,国际科学界已充分认识到,人类表型组是继基因组之后生命科学的又一个战略制高点和原始创新源,人类表型组大科学计划将深刻地改变生命科学领域的科研面貌,引领生命科学的范式变革。
人类表型组关联网络。主办方供图
会议透露,我国科学家已初步绘制全球首张人类表型组导航图。据中国科学院院士、复旦大学校长、上海国际人类表型组研究院院长金力介绍,人类表型组的“导航图”就是几万种甚至十万种不同人类表型之间的关联图。2020年,依托在张江复旦国际创新中心建成的世界首个跨尺度、多维度人类表型精密测量平台和自主研发的全过程、自动化表型组大数据平台,中国科学家开始在上海进行“上海自然人群健康表型核心队列研究”,截至2021年11月19日,已有超过730位常住上海的20到60岁志愿者完成了在张江平台2天1夜、每人测量超3万个指标的全景表型测量。这使得我国科学家首次获得了自然人群样本贯通宏观至微观尺度20余个领域类别的海量表型基线大数据,数据总量超过了3PB。
经过多学科团队对现有数据的协同分析攻关,科学家们发现了不同表型间超过150万个强关联,其中约39%为跨尺度关联,且大部分关联是科学界首次看到。通过这些强关联形成的网络,中国科学家初步绘制了基于上海核心队列的全球首张人类表型组参比导航图。目前,面向科研用户的导航图数据库网站已经上线公测,多支科学团队正在从现有1.0版的导航图中,筛选具有重大科学意义和应用价值的强关联,开展进一步科研攻关。
根据构想,人类表型组国际大科学计划最终将在全球各大洲代表性人群中进行5万人、每人10万个以上表型指标的全景测量和超过50万人的特定表型应用示范测量。这一宏大目标,需要全球多个团队通过统一标准下的“分布式”协同测量与数据分享才能最终实现。
科研数据的跨境共享与开放是人类表型组计划不可或缺的前提条件。理事会上,国际人类表型组研究协作组(IHPC)理事会就人类表型组大科学计划下科研数据跨境共享与开放的基本原则达成共识。