前不久,从4300米海拔的西藏羊八井传来好消息:中日科学家成功“捕捉”迄今宇宙最高能量的伽玛射线——能量高达450TeV(万亿电子伏特),比此前已知的75TeV的最高能量高出5倍以上。发现100TeV以上的超高能伽玛射线,被誉为打开了探索极端宇宙问题的新窗口。
“利用西藏羊八井得天独厚的优势,中日、中意合作进行宇宙线实验,每年产生超过数百TB的原始数据,数据从羊八井传回中科院高能物理所,再分别传到日本、意大利分析处理,合作单位进而能实时访问数据。”国家高能物理科学数据中心主任陈刚说,要想获得真正的物理成果,就必须对高能物理实验产生的大量数据进行分析、处理。同时,高能物理领域采用全球大科研的工作模式,其研究也离不开数据的共享和利用。
今年6月,国家科技资源共享服务平台迎来优化调整,中科院高能物理科学数据中心也成为名副其实的“国家队”——国家高能物理科学数据中心。
值得一提的是,国家高能物理科学数据中心支撑的重大成果竞相涌现。我国首颗大型X射线天文卫星“慧眼”观测数据,全面支持“慧眼”成功监测到引力波源所在的天区,为深入理解该引力波事件和引力波闪的物理机制作出重要贡献。利用高能物理科学数据中心提供的服务,北京谱仪国际合作组取得“首次发现带电类粲偶素Zc(3900)”、确认X(3823)等重大物理成果。
“高能物理实验造价昂贵,其数据质量控制对实验的科研和社会效益极其重要。”陈刚介绍,从数据分类、采集、传输、整合、共享、分析和科技资源挖掘、产品加工推广等方面需要制定严格的数据质量控制规范和流程,采取不同的技术手段保证数据的可靠性、完整性。
大科学装置立项、建设和运行过程中,都把科学数据系统作为不可或缺的部分。面对海量科学数据的收集和处理,陈刚显得自信满满,“国家高能物理科学数据中心在数据资源来源、收集、整合以及科技资源挖掘、产品加工推广、数据共享和利用等方面,已形成比较成熟稳定的机制和方案,具有良好的资源持续收集与服务能力。”
据介绍,国家高能物理科学数据中心以高能物理领域重大科技基础设施产生的科学数据为核心,评估并梳理科学数据资源目录,以标准化的手段实现异地建设的实验装置数据、异地数据分中心和高能所本地数据中心实验数据的汇交,构建并维护运行的高能物理数据计算平台集成各个实验的多种异构资源。
“通过一整套完善的运行机制,为各实验装置以及高能物理前沿研究提供不同的计算模式和稳定的计算、数据服务。”陈刚告诉科技日报记者,国家高能物理科学数据中心拥有十几PB存储空间、数万CPU核计算能力、万兆国际网络链路和完善的信息化支撑系统,可提供资源整合、数据共享、数据资源和索引等服务,能有效支撑高能物理科研数据管理和共享需求。
陈刚说,高能物理领域采用全球大科研的工作模式,国家高能物理科学数据中心与国内外上百所大学、科研机构建立了长期稳定的合作关系,支持包括大型强子对撞机、大亚湾等多个国内外大型实验的科学数据处理,可提供数据的高速传输、本地缓存等。
“我国高能物理领域在科学数据的获取、存储、处理及共享方面皆有广泛的国际合作,在相关技术路线、策略机制等方面处于国际同等水平。”陈刚坦言,但在科学数据中心规模、资源能力、软件能力和人力资源投入上,与国际同领域差距较大。
优化调整后,国家高能物理科学数据中心面临什么挑战?陈刚提出,中心无论在基础设施、服务能力,还是资源汇聚、软件研发、标准规范、组织架构上尚需加强和优化。着眼未来,则要推动高能物理领域大装置实验过程和实验数据的利用、共享的自动化和规范化。