Anthropic 共同创始人 Jack Clark 在 2026 年 5 月 4 日发布的新闻通讯《Import AI》中表示,到 2028 年底,出现“几乎不需要人类参与的 AI 研发”的概率超过 60%。他所指的,是前沿 AI 模型强大到可以在很大程度上自主构建自己的后继版本。
Clark 将这一状态描述为:AI 系统具备足够的能力,可以在端到端流程中主导下一代模型的设计、实验与训练。他坦言,这将是一个“非常重大的事件”,甚至让他本人也难以完全消化其含义——一旦 AI 研发被高度自动化,人类将进入一个极难预测的未来。

到 2028 年底:AI 自主构建后继模型的概率“超过 60%”
Clark 并不认为在 2026 年内就会出现完全自动化的 AI 研发体系。但他判断,在未来一两年内,可能会出现“模型端到端训练后继模型”的早期案例,尤其是在非最前沿的大模型(非 frontier model)层面,有望率先实现概念验证。
他强调,这一判断主要基于公开信息:包括 arXiv、bioRxiv、NBER 上的论文,以及各家前沿 AI 公司已经对外发布的产品和技术细节。在他看来,构建当前一代 AI 系统所需的关键工程组件,正在逐步被“可自动化的模块”所替代或封装。
不过,Clark 也指出,AI 研究不仅需要工程堆叠,还离不开创造性和“异端式”的洞见。目前的 AI 系统尚未在这种创造性上展现出“颠覆级”的能力。因此,他对“在 2027 年之前就实现高度自动化的 AI 研发”的概率估计仅为 30%。
支撑判断的两大趋势:代码能力与长时任务能力
Clark 将“AI 研发自动化正在逼近”的主要依据,归结为两点:一是 AI 的编程与软件工程能力,二是 AI 在长时间连续执行复杂任务方面的进步。
在代码能力方面,他引用了 GitHub 实际问题解决能力评测基准 SWE-Bench 的数据:该基准衡量模型在真实 GitHub issue 上完成修复的能力。2023 年下半年刚开始测试时,Claude 2 的成功率仅约 2%;而到了 Claude Mythos Preview,这一成功率已达到 93.9%,几乎接近基准被“做满”的水平。
在长时任务执行方面,他引用了评估 AI 代理持续工作能力的 METR “time horizon” 指标。该指标关注:在 50% 可靠性水平下,模型能稳定完成多长时间跨度的任务。
- 2022 年,GPT-3.5 的 50% time horizon 约为 30 秒;
- 到 2026 年,Opus 4.6 已经可以在约 12 小时的任务上维持 50% 的可靠性。
2026 年 5 月 8 日,METR 又将 Claude Mythos Preview 的早期版本纳入评估。根据 METR 的公开信息,该模型在 50% time horizon 上“至少可能达到 16 小时”。不过,METR 也提醒,目前的任务集在 16 小时以上区间的测量可靠性仍然有限。

■ Claude Mythos Preview(early)在 50% time horizon 上“至少可能达到 16 小时”

Anthropic 正式研究议程:将“AI-driven R&D”列为重点方向
Clark 目前负责 2026 年 3 月宣布成立的研究机构 “The Anthropic Institute”。Anthropic 在 2026 年 5 月 7 日公开的该研究所研究议程中,将“AI-driven R&D”(由 AI 驱动的研发)明确列为重点研究领域之一。
在这份议程中,Anthropic 指出:随着 AI 系统能力增强,越来越多的科学研究环节将以自律或半自律的方式由 AI 完成。尤其在 AI 研究本身上,更强大的 AI 系统有可能参与甚至主导下一代模型的开发。
2026 年 4 月 14 日,Anthropic 还发布了名为《Automated Alignment Researchers》的研究工作,让 Claude 在一定范围内“自律地”开展对齐(alignment)研究。
在该实验中,研究团队让 9 个 Claude Opus 4.6 协同工作,负责提出研究想法、设计并执行实验、分析结果,并与其他 AI 共享发现。在限定的任务范围内,这一 AI 研究团队在表现上超过了人类研究者设定的基线。
不过,Anthropic 也在论文中强调,这并不意味着当前的前沿模型已经成为“通用的对齐研究员”。这些成果更多说明:在特定、受控的研究子任务上,AI 已经可以承担相当一部分工作。
关键问题:AI 发展速度与治理能力能否匹配
需要强调的是,Clark 的上述判断来自他个人在《Import AI》中的分析,而非 Anthropic 的官方时间表。因此,这并不是在宣称“到 2028 年底,AI 一定能完全自主研发下一代 AI”,而是对未来几年前景的一种概率性评估。
但另一方面,Anthropic 在 The Anthropic Institute 的正式研究议程中,将 AI-driven R&D 作为重点方向,说明“AI 通过加速自身研发来推动前沿进展”已经不再只是科幻设想,而是前沿 AI 公司正在认真对待的现实研究课题。
Clark 表示,基于目前公开的技术进展,他开始认为:那些长期被视为科幻题材的场景,可能正在转变为真实的技术趋势。如果这一趋势持续下去,人类社会的运行方式和治理结构,都可能面临深刻变化。