新型探测器芯片将X射线数据实时压缩至原来的1/100–1/200

每秒钟,前沿科学实验都会产生海量数据,多到足以拖慢数据传输和后续分析的速度,进而影响研究进展。为应对这一挑战,美国能源部(DOE)阿贡国家实验室的研究人员研制出一款新型计算机芯片,专门用于快速压缩和处理先进X射线探测器产生的大量数据,例如来自DOE科学办公室用户设施——阿贡先进光子源(APS)上的探测器数据。通过在数据源头进行压缩,就像在传输前压缩电影或音乐文件一样,这项技术让实验过程更快、更高效,也更有利于挖掘关键信息。

当X射线或电子束照射样品时,探测器会捕捉到由此产生的信号,这一过程类似数码相机用光线生成照片。探测器将这些信号转化为电脉冲,再进一步数字化为计算机可处理的数据。然而,现代探测器的输出数据量极其庞大,即便是单帧中包含的有用信息很少,也会被完整发送用于存储和分析。这会给计算系统带来巨大负担,拖慢研究节奏,使科学家更难从中筛选出最关键的部分。

阿贡及芝加哥大学物理学家 Antonino Miceli 表示:“我们的目标是把更多计算能力前移到数据产生的地方。”他介绍说,在此前的研究中,团队已经证明可以利用先进的数学方法对数据进行压缩,同时保留分析所需的关键信息。如今,借助新型芯片技术和微电子学的发展,他们打造出一款能将这些数学运算直接集成到探测器内部的芯片。利用APS 8-ID光束线采集的数据,探测器可以在数据采集的同时即时完成压缩。

这意味着科学家可以直接在压缩后的数据上进行关键计算,而无需先进行解压缩步骤。由此,他们能够更快地分析结果并获得反馈,甚至可以在实验进行过程中实时调整。

数据驱动:能从实验中“学习”的芯片

在这一基础上,研究团队进一步将一个高速、紧凑的矩阵数学处理器集成进探测器芯片。芯片不再把每个像素的完整信息都传输出去,而是将每一幅图像“浓缩”为一组紧凑的数字,保留对科学家最重要的特征。输出数据的大小始终固定,并以流式方式实时传输,从而简化了数据管理和传输流程。

为了让芯片更具实用性和灵活性,它可以针对具体实验进行定制。在实验前或实验过程中,科学家可以向芯片上传预设的“权重”,告诉芯片应重点保留哪些特征。这一过程类似于训练一个人工智能(AI)模型:利用样本数据对芯片进行“训练”,让它在每个实验中聚焦最相关的信息。这项成果已发表在《仪器学杂志》(Journal of Instrumentation)上。

阿贡科学家周涛(Tao Zhou)解释说:“本质上,这块芯片可以针对实验中最重要的内容进行训练,从而实现实时压缩和数据减少。硬件本身非常灵活,可以适配不同类型的压缩或数据减少方法,比如径向积分。”周涛在APS与纳米尺度材料中心(CNM)共用的光束线上开展工作,CNM同样是阿贡的DOE科学办公室用户设施。

测试和设计研究表明,这种芯片内数据处理方法可以将数据量减少约100至200倍,同时支持每秒百万帧的运行速度。由此不仅大幅降低了数据传输量,还减少了功耗和所需电缆数量,使实验成本更低、效率更高,也更便于未来扩展。

通过将智能数据压缩与高速硬件结合,科学家能够在实验过程中实时获得分析结果并立即调整实验方案,加快从实验到发现的整个周期,最大化利用光束线的每一分钟。阿贡团队目前正推动这款芯片从设计阶段走向大规模制造,并计划在实际实验环境中部署应用。

Miceli 指出:“APS上的实验将会显著受益于这项技术。通常的瓶颈在探测器,而不是X射线源。要充分发挥光源的能力,我们就需要这样的技术。这项工作也展示了探测器开发者与领域科学家紧密合作所能产生的巨大影响。”


分享:


发表评论

登录后才可评论。 去登录