真菌在生态系统中扮演多重角色:既可能与植物形成互利关系,也可能作为分解者参与枯木等有机物的分解。研究人员指出,不少真菌并不局限于单一生态功能,而是会随环境条件变化在不同生活方式之间切换。对这种“生活方式灵活性”的识别,被认为有助于理解并评估森林与农田在气候变化背景下的响应。
不过,与真菌生活方式相关的信息长期分散在数十年的科学论文中,依靠人工梳理与更新数据库不仅耗时,也难以随着新研究持续扩展。

北亚利桑那大学博士生Beatrice M. Bock领导的一项研究提出了自动化解决方案。研究显示,团队使用名为BioBERT的专用语言模型,构建了一套可自动评估科学论文摘要的流程,用于判断真菌属于单一生活方式还是具备双重、可切换的生活方式。该研究近期发表在《Research Ideas and Outcomes》杂志上。
在方法验证环节,研究对比测试了四种不同的人工智能模型,以评估其对生物学文本细微差别的理解能力。结果显示,BioBERT在识别真菌生活方式方面的表现最佳,准确率接近90%。

Bock在研究中提到,BioBERT的一项优势在于能够区分大小写。她发现,区分大小写的模型整体表现明显优于不区分大小写的模型。研究认为,这可能与物种学名常以大写字母标示有关,例如镰刀菌(Fusarium),而这类信息有助于模型更准确把握文本语境。
为提升研究透明度与可复用性,Bock已将相关代码与数据免费公开,供其他研究人员在此基础上拓展应用,例如用于追踪昆虫或植物等其他生物的特征。
研究同时指出,该工作目前以少量论文作为概念验证,但为更大规模的自动化文本挖掘项目提供了路径。Bock表示,随着真菌特征数据库在生物多样性评估中的重要性提升,自动化文本挖掘有望提高特征注释的效率、一致性与覆盖范围。
发表评论
登录后才可评论。
去登录
