当前位置: 您当前的位置 : 科技金融网  ->  创新  -> 正文

《Cell》发表中山大学、阿里云联合研究成果:AI发现超16万种RNA病毒

2024年10月11日 16:44:46 来源:科技日报 作者:崔爽

  科技日报记者 崔爽

  记者10月10日获悉,国际学术期刊《Cell》(《细胞》)发表中山大学与阿里云合作的科研成果,研究团队利用云计算与人工智能(AI)技术发现了180个超群、16万余种全新RNA病毒,是已知病毒种类的近30倍,大幅提升业界对RNA病毒多样性和病毒演化历史的认知。

  该研究成果提出了一种基于深度学习的RNA病毒发现方法,是深度学习算法在病毒发现领域的重要进展,为病毒学研究开创全新范式。

  病毒与人类健康密切相关,但人类已知已确认的病毒种类仅有5000余种,是病毒世界的冰山一角。传统RNA病毒鉴定方法高度依赖序列同源性比对,即通过比较未知病毒与已知病毒的序列相似性来进行识别。然而,RNA病毒种类繁多且高度分化,传统方法难以捕捉缺乏同源性或同源性极低的“暗物质病毒”,新病毒发现的效率较低。

  AI与病毒学研究的结合正在突破这一难题。本篇论文提出了全新的深度学习模型“LucaProt”,它基于Transformer框架与大模型表征技术,结合蛋白质序列和内在结构性特征,在独立的测试数据集上表现优异,具有极高准确性(假阳性率仅为0.014%)和特异性(假阴性率为1.72%)。

  据介绍,研究团队对来自全球生物环境样本的10487份数据进行病毒挖掘,发现了513134条病毒基因组,代表161979个潜在病毒种及180个RNA病毒超群。使RNA病毒超群数量扩容约9倍,病毒种类增加约30倍,其中23个超群无法通过序列同源方法识别,被称为病毒圈的“暗物质”。

  该论文还揭示多个病毒学领域新发现:发现迄今为止最长的RNA病毒基因组,长度达到47250个核苷酸;识别出超出以往认知的基因组结构,展示了RNA病毒基因组进化的灵活性;此外,在高温的深海热泉等极端环境中,RNA病毒依旧存在多样性。

  中山大学医学院教授施莽表示:“在科研领域,AI的应用已经势不可挡,通过AI方法探索科学问题已取得重要突破。这种研究范式将成为未来科学界的常态,也可能成为我们认知世界的重要手段。”

  该论文共同第一作者、阿里云飞天实验室算法专家贺勇表示:“基于AI+病毒学的新研究框架刷新了人类对病毒圈的认识,这种认识的不断完善,有助于人类对未来可能发生的大流行进行预警,以及进一步推动RNA病毒疫苗的研发。”

  据悉,过去几年,阿里云积极与国内高校和研究机构展开合作,在生命科学领域已发表核酸和蛋白质统一基础模型-LucaOne、RNA病毒发现-LucaProt、磷循环蛋白家族识别-LucaPCycle等研究成果。

  (采访对象供图)

[编辑: 王姝]
(本文来源:科技日报)
  • 科技金融时报
Copyright © 2014 kjjrw.com.cn. All rights reserved. 浙ICP备2024107310号
互联网新闻信息服务许可证 33120170005

浙公网安备33010602013724<

联系我们

地址:杭州市文一路115号
举报电话:0571-87089618
法律顾问:北京京师(杭州)律师事务所陈佳律师