谷歌与哈佛团队打造 ERA:自动生成科学软件,在关键基准上超越人类代码

richlovec 1500_400 (1)
 

自动写科学软件的 AI 系统

由谷歌研究团队与哈佛大学约翰·A·保尔森工程与应用科学学院(SEAS)合作完成的一项新研究,展示了一种可以自动编写科学软件程序的人工智能系统,其在多项任务中的表现优于人类专家编写的代码。相关论文已发表于《自然》(Nature)杂志。

这套系统名为“经验研究辅助”(Empirical Research Assistance,简称 ERA),由哈佛 SEAS 应用数学与物理催化教授迈克尔·布伦纳(Michael Brenner)与谷歌 DeepMind 的 Shibl Mourad 共同领导。哈佛博士生朱千泽、瑞安·克鲁格(Ryan Krueger)和莎拉·马丁森(Sarah Martinsen)以谷歌学生研究员身份参与项目,并在布伦纳团队中开展研究。

布伦纳目前担任哈佛大学设立的催化教授职位,该职位旨在支持资深教师在企业中担任研究角色,推动学术界与私营部门之间更紧密的合作。

什么是“经验软件”?

在当代科学研究中,研究人员常常为特定实验或假设编写专用软件,用于测试理论或分析复杂数据。作者将这类专门为完成某一科学任务而设计的程序称为“经验软件”,其唯一目标是最大化在特定科学任务上的表现,例如:

  • 预测天气变化;
  • 估算传染病暴发期间的住院人数;
  • 根据生物数据进行结构或功能预测等。

只要问题的结果可以用一个数值“得分”来衡量,就可以被视为“可评分任务”。

用于解决这类可评分任务的经验软件,已经支撑了多个领域的重要突破,其中包括最近三项化学诺贝尔奖背后的关键计算工具。然而,这类软件通常需要研究人员投入大量时间手动编写、测试和反复优化代码,开发成本高、周期长。

ERA:自动化软件设计循环

ERA 的核心目标,是将科学软件从“人工设计+人工调参”的模式,转变为“自动生成+自动优化”的闭环过程,从而消除传统软件开发中的瓶颈。过去,这一过程往往需要专家耗费数月甚至数年时间,而 ERA 可以在远短于人类的时间尺度内完成同类工作。

ERA 系统结合了谷歌的 Gemini 大型语言模型与一套搜索策略,能够在大规模代码空间中自动探索和优化数以千计的程序版本,其速度和覆盖范围都远超人类工程师。

具体流程上,系统从针对某个科学问题的基础代码出发,通过以下方式不断改进程序:

  • 添加新的功能模块;
  • 替换或调整算法;
  • 组合不同研究思路和已有工具。

每一次修改的目标,都是提升预先设定的“质量得分”。例如:

  • 在传染病建模中,提高基于历史住院数据预测未来住院人数的准确度;
  • 在结构生物学中,提高根据氨基酸序列预测蛋白质三维结构的精度。

借鉴 AlphaGo 的搜索策略

ERA 采用了一种树搜索方法来决定探索方向,这与 AlphaGo 等围棋 AI 系统使用的技术类似。系统会在“代码版本树”中:

  • 评估哪些修改方向更有前景;
  • 决定哪些候选方案值得继续深入优化;
  • 舍弃表现不佳或改进空间有限的路径。

通过这种方式,ERA 能够在庞大的程序空间中高效筛选出性能更优的模型,用于预测住院人数、推断蛋白质形状等任务。

AI 与人类知识的结合

ERA 并不是在“信息真空”中工作。它可以主动利用现有的科学知识:

  • 用户可以直接提供相关论文、教科书或技术报告;
  • 系统也可以自动检索相关文献,将其中的研究思路融入后续代码版本。

布伦纳指出,这种自动整合和重组研究思路的能力,使 ERA 有机会找到“人类研究者可能永远不会有时间去尝试”的解法,相当于在庞大的可能性空间中“从大海中捞针”。

在神经科学与健康领域的验证

为检验 ERA 的实际效果,哈佛与谷歌团队将其应用到多个真实科学问题中。

哈佛博士生朱千泽负责利用 ERA 预测斑马鱼大脑中超过 7 万个神经元的活动,并与真实的神经记录数据进行对比。

在其中一项实验中,团队让 ERA 调用现有的神经元建模库,自动构建更符合物理规律的神经活动模拟模型。按朱千泽的说法,如果由他本人手动学习并整合这些新软件包,可能需要数周甚至数月,而 ERA 能够自动完成模型的组装与调优。

朱千泽表示,这套系统有望显著加速科学发现过程:“它让你可以同时探索大量想法。过去实现某个具体方法可能要花一周时间,现在可以在几小时内并行跑完多个方案。”

在疫情预测与单细胞分析中的表现

研究团队还在公共卫生和生物信息学领域对 ERA 进行了测试:

  • 在一项针对 COVID-19 的实验中,ERA 自动生成了 14 个用于预测住院人数的模型,其整体表现优于美国疾病控制与预防中心(CDC)在疫情期间采用的最佳模型;
  • 在另一项实验中,ERA 找到了 4 种整合单细胞 RNA 测序数据集的新方法,这些方法在性能上超过了当时最先进的人类设计方案。

从数月到数小时:科研工作方式的改变

通过将“探索一组研究思路”所需的时间,从传统的数月压缩到数小时或数天,ERA 为科学家释放出大量时间和精力。

谷歌在介绍这一成果的博客中指出,这样的系统可以让研究人员把更多精力投入到真正具有创造性和战略性的工作上,例如:

  • 确定哪些科学问题最值得优先攻克;
  • 设计新的实验范式和研究方向;
  • 思考科学发现如何应对现实社会挑战。

而像 ERA 这样的自动化工具,则负责承担大量重复、耗时但又必不可少的软件设计与调优工作,为科学研究提供一个高效的“计算实验室助手”。


分享:


发表评论

登录后才可评论。 去登录