Sakana AI“AI科学家”研究登上《Nature》:首次验证AI科学的“规模定律”

richlovec 1500_400 (1)
 

东京本部的AI研究企业 Sakana AI 等组成的研究团队宣布,其关于全自动科研系统「AI Scientist」的论文已于 2026 年 3 月 25 日发表于科学期刊《Nature》。论文题为《The AI Scientist: Towards Fully Automated AI Research》。

这项研究构建了一个几乎覆盖科研全流程的自动化系统:从研究主题构思、实验设计与执行,到结果分析、论文撰写乃至审稿评价,都由 AI 自主完成。团队还报告称,他们在实验中确认了一条适用于“AI科学”的“规模定律”:基础模型性能越强,AI 自动生成的研究论文质量也随之提升。

AI自动执行科研全流程

AI Scientist 被设计为一个覆盖研究生命周期的自动化流水线,AI 会按顺序完成以下步骤:

  • 生成研究创意与研究主题
  • 通过文献调研确认研究的新颖性
  • 生成实验代码
  • 执行实验
  • 对实验结果进行分析与可视化
  • 撰写论文
  • 进行审稿与质量评价

通过这一机制,从研究构思到论文成稿的关键环节,都可以在极少人工干预的情况下由 AI 自主完成。

AI Scientist 的研究流程:展示了从研究创意生成、实验设计、超参数调优、研究执行、消融实验分析,到论文撰写与 AI 审稿的一体化自动化过程

The AI Scientist workflow.jpg

AI生成论文首次通过正式同行评审

在验证实验中,研究团队让 AI Scientist 自动生成多篇机器学习领域的研究论文,并将其中部分论文投稿至国际学术会议的相关研讨会(Workshop)。

结果显示,其中一篇由 AI 完整生成的论文在同行评审中获得了平均 6.33 分(单个评审打分为 6、7、6),超过了该研讨会的录用标准,意味着这篇论文在正常评审流程下是“可被接收”的。

不过,按照预先设定的研究协议,团队最终主动撤回了这篇论文,理由是其完全由 AI 生成。研究团队指出,这一过程本身已经构成“由 AI 独立撰写的论文通过正式同行评审”的首批实证案例之一。

构建AI审稿系统「Automated Reviewer」

为客观评估 AI 生成论文的质量,团队还开发了 AI 审稿系统「Automated Reviewer」。

该系统会对论文内容进行解析,从研究的合理性、创新性、实验设计与呈现质量等多个维度给出评分与文字评价。根据研究团队的报告,Automated Reviewer 给出的评分结果,与人类审稿人之间的一致程度,大致相当于不同人类审稿人之间的互相一致水平。

这意味着,在一定范围内,AI 审稿系统已经可以模拟人类评审的判断标准,用于大规模、快速地评估论文质量。

首次验证“AI科学的规模定律”

本次研究中最受关注的发现之一,是对“AI科学规模定律”的系统性验证。

研究团队利用 Automated Reviewer,对由不同规模与能力的基础模型驱动的 AI Scientist 所生成的论文进行打分比较。结果表明:

  • 当底层基础模型能力提升时,
  • AI Scientist 自动生成的论文在 Automated Reviewer 中获得的评分也随之显著提高。

换言之,模型规模与能力越强,AI 在科研任务中的“研究产出质量”也越高,呈现出类似于大模型在语言任务中常见的“Scaling Law(规模定律)”。

AI Scientist 探索研究主题的过程:通过树状搜索生成多条实验路线,并从中选择最优的研究结果

The phases and compute scaling of the AI Scientist.jpg

研究团队据此推断:随着基础模型能力的持续提升以及计算资源的进一步增加,AI Scientist 这类系统在科研中的实际能力还有大幅跃升空间。

或将重塑科学研究的推进方式

AI Scientist 采用多种基础模型协同工作的“智能体(Agent)”架构,以循环方式不断进行研究方向探索与实验迭代:

  • 自动提出并筛选研究想法
  • 自动设计并运行实验
  • 自动分析结果并更新研究方向

研究团队认为,这类系统有潜力极大加速研究创意的探索与实验自动化进程,从而在中长期内改变科学研究的组织方式与推进节奏。

与此同时,研究者也强调,AI 自动生成论文并参与审稿,会对现有学术评价体系和科研伦理带来新的挑战。例如:

  • 如何在投稿与评审中透明标注 AI 参与程度
  • 如何防止低质量或“虚构”研究被大规模生成并冲击期刊与会议
  • 如何在效率提升与学术诚信之间取得平衡

这些伦理与社会问题,亟需与技术发展同步展开更深入的讨论与规范制定。


分享:


发表评论

登录后才可评论。 去登录