大脑在加工语言时,需要实时调动多个脑区的神经元进行协同工作。构建高时空分辨率的神经影像数据可以帮助我们更好地了解各个脑区以及脑区之间的协同合作,对于研究大脑的语言加工机制至关重要。
当前已有的开源数据主要针对英文采集,只包括单一模态的神经影像数据,如高空间分辨率的功能核磁共振或高时间分辨率的脑磁图,并且大多使用1小时以内的实验材料,数据规模有限,无法借助数据需求量大的计算模型进行更全面、更深入的大脑语言加工机制探索。
为突破上述问题,中国科学院自动化研究所自然语言处理研究组历时近两年,采集处理完成了到目前为止国际上规模最大、包括信息最丰富的汉语同步多模态神经影像数据集,并于近日正式对外发布。
该数据集的公开发布可以为全方位研究大脑在真实场景下理解词汇、短语和句子时如何调动不同脑区以及不同脑区之间如何协同工作等科学问题提供重要支撑。
(总台央视记者 帅俊全)