“大蜜蜂计划”推动自然历史藏品数字化研究升级

richlovec 1500_400 (1)
 

博物馆自然历史藏品长期为科学研究提供基础支撑,但以盒装、抽屉保存的实体标本在面对新一代数据密集型研究方法时,信息提取与量化仍存在难点。加州大学圣塔芭芭拉分校(UCSB)Cheadle生物多样性与生态恢复中心主任Katja Seltmann提出“大蜜蜂计划”,希望将自然历史藏品研究带入人工智能、大数据与网络数据库驱动的工作流程。

牵头多机构合作,建设蜜蜂图像与性状数据集

“大蜜蜂计划”由UCSB牵头,联合美国13个机构开展合作,目标是创建超过100万张高分辨率二维与三维蜜蜂标本图像,并配套建立带注释的蜜蜂性状数据集。

在遗传学与基因组学兴起之前,科学界主要依赖表型等物理特征来理解生物在生命树中的位置。长度、重量、颜色等性状相对容易测量,但形状、图案等复杂性状难以用传统方式实现稳定量化。Seltmann团队表示,其工作尝试在大数据规模上利用博物馆标本研究蜜蜂表型变异,并引入机器学习、计算机视觉与众包等手段推进数据采集与分析。

众包与机器学习并行推进性状量化

在数据构建方面,团队将蜜蜂的高清照片上传至“自然笔记”数据库,组织超过5000名志愿者参与蜜蜂体型测量,从而形成带注释的数据集。研究人员称,志愿者提供的数据与受过训练的科学家结果相当,显示众包在此类任务中的效率。

在另一项工作中,团队利用计算机视觉与机器学习对蜜蜂毛发密度与颜色进行量化,并据此描述了611个蜜蜂物种,覆盖377个属。团队还在《功能生态学》期刊发表论文,讨论毛发覆盖度与蜜蜂适应不同气候及环境变化之间的相关性。

自动化翅脉识别探索无创物种鉴定

Seltmann同时与UCSB计算机视觉专家、工程学教授B.S. Manjunath合作,研究蜜蜂翅膀结构。翅脉是物种鉴定的重要特征,但现阶段往往需要专家投入数小时进行分析。双方希望通过自动化手段提升效率,以支持现场拍照实现快速、无创的物种识别。

项目影响延伸至更广泛的藏品研究方法

UCSB方面称,其在“大蜜蜂计划”中的工作已产出36篇出版物、63个海报与报告演讲,以及23个共享数据集和报告。相关团队认为,该项目的意义不局限于昆虫学,也为自然历史藏品研究试点了多项技术路径,并推动形成新的工作标准,包括确定复杂性状可量化指标及相应方法。

Seltmann指出,相比计数与直接测量,描述生命形态更具挑战,叶片形状或翅脉结构等特征往往带有主观性。她表示,研究人员持续尝试将这类信息转化为数字、矩阵与图表等可计算形式,并构建大型语言模型与神经网络,用于识别与组织新型数据。

BisQue平台扩展图像存储与分析能力

Manjunath表示,图像数据在科学研究与日常生活中的普及程度不断提高,存储图像成为直观选择。他的实验室开发了BisQue平台,用于云端存储、可视化、组织与分析图像。除参与蜜蜂翅脉研究外,Manjunath团队还将BisQue用于多项课题,包括从CT扫描中检测神经病变、从航拍照片识别草原犬鼠等。该系统支持100多种文件格式,并可按项目扩展定制软件模块。团队目前正推进将自然语言处理集成至BisQue界面,以实现更自然的人机交互。

计划收尾后研究仍将延续

报道指出,当前“大蜜蜂计划”即将结束,但Seltmann关于自然历史藏品的相关研究将继续。她下一阶段的工作将扩大已记录数据的访问权限,面向其他学科研究人员与专业人士开放,并重点关注与工程师、材料科学家的合作,以探索生物学在应对人类挑战方面的潜在应用。


分享:


发表评论

登录后才可评论。 去登录