Anthropic 联合创始人：到 2028 年底，AI 自主研发下一代 AI 的概率或超 60％

AI 2026-05-11 Anthropic, 人工智能, AI 研发自动化, 大模型, AI 治理 17 次浏览

Anthropic 共同创始人 Jack Clark 在 2026 年 5 月 4 日发布的新闻通讯《Import AI》中表示，到 2028 年底，出现“几乎不需要人类参与的 AI 研发”的概率超过 60％。他所指的，是前沿 AI 模型强大到可以在很大程度上自主构建自己的后继版本。

Clark 将这一状态描述为：AI 系统具备足够的能力，可以在端到端流程中主导下一代模型的设计、实验与训练。他坦言，这将是一个“非常重大的事件”，甚至让他本人也难以完全消化其含义——一旦 AI 研发被高度自动化，人类将进入一个极难预测的未来。

Import AI 455.jpg

到 2028 年底：AI 自主构建后继模型的概率“超过 60％”

Clark 并不认为在 2026 年内就会出现完全自动化的 AI 研发体系。但他判断，在未来一两年内，可能会出现“模型端到端训练后继模型”的早期案例，尤其是在非最前沿的大模型（非 frontier model）层面，有望率先实现概念验证。

他强调，这一判断主要基于公开信息：包括 arXiv、bioRxiv、NBER 上的论文，以及各家前沿 AI 公司已经对外发布的产品和技术细节。在他看来，构建当前一代 AI 系统所需的关键工程组件，正在逐步被“可自动化的模块”所替代或封装。

不过，Clark 也指出，AI 研究不仅需要工程堆叠，还离不开创造性和“异端式”的洞见。目前的 AI 系统尚未在这种创造性上展现出“颠覆级”的能力。因此，他对“在 2027 年之前就实现高度自动化的 AI 研发”的概率估计仅为 30％。

支撑判断的两大趋势：代码能力与长时任务能力

Clark 将“AI 研发自动化正在逼近”的主要依据，归结为两点：一是 AI 的编程与软件工程能力，二是 AI 在长时间连续执行复杂任务方面的进步。

在代码能力方面，他引用了 GitHub 实际问题解决能力评测基准 SWE-Bench 的数据：该基准衡量模型在真实 GitHub issue 上完成修复的能力。2023 年下半年刚开始测试时，Claude 2 的成功率仅约 2％；而到了 Claude Mythos Preview，这一成功率已达到 93.9％，几乎接近基准被“做满”的水平。

在长时任务执行方面，他引用了评估 AI 代理持续工作能力的 METR “time horizon” 指标。该指标关注：在 50％可靠性水平下，模型能稳定完成多长时间跨度的任务。

2022 年，GPT-3.5 的 50％ time horizon 约为 30 秒；
到 2026 年，Opus 4.6 已经可以在约 12 小时的任务上维持 50％的可靠性。

2026 年 5 月 8 日，METR 又将 Claude Mythos Preview 的早期版本纳入评估。根据 METR 的公开信息，该模型在 50％ time horizon 上“至少可能达到 16 小时”。不过，METR 也提醒，目前的任务集在 16 小时以上区间的测量可靠性仍然有限。

■ Claude Mythos Preview（early）在 50％ time horizon 上“至少可能达到 16 小时”

Anthropic 正式研究议程：将“AI-driven R&D”列为重点方向

Clark 目前负责 2026 年 3 月宣布成立的研究机构 “The Anthropic Institute”。Anthropic 在 2026 年 5 月 7 日公开的该研究所研究议程中，将“AI-driven R&D”（由 AI 驱动的研发）明确列为重点研究领域之一。

在这份议程中，Anthropic 指出：随着 AI 系统能力增强，越来越多的科学研究环节将以自律或半自律的方式由 AI 完成。尤其在 AI 研究本身上，更强大的 AI 系统有可能参与甚至主导下一代模型的开发。

2026 年 4 月 14 日，Anthropic 还发布了名为《Automated Alignment Researchers》的研究工作，让 Claude 在一定范围内“自律地”开展对齐（alignment）研究。

在该实验中，研究团队让 9 个 Claude Opus 4.6 协同工作，负责提出研究想法、设计并执行实验、分析结果，并与其他 AI 共享发现。在限定的任务范围内，这一 AI 研究团队在表现上超过了人类研究者设定的基线。

不过，Anthropic 也在论文中强调，这并不意味着当前的前沿模型已经成为“通用的对齐研究员”。这些成果更多说明：在特定、受控的研究子任务上，AI 已经可以承担相当一部分工作。

关键问题：AI 发展速度与治理能力能否匹配

需要强调的是，Clark 的上述判断来自他个人在《Import AI》中的分析，而非 Anthropic 的官方时间表。因此，这并不是在宣称“到 2028 年底，AI 一定能完全自主研发下一代 AI”，而是对未来几年前景的一种概率性评估。

但另一方面，Anthropic 在 The Anthropic Institute 的正式研究议程中，将 AI-driven R&D 作为重点方向，说明“AI 通过加速自身研发来推动前沿进展”已经不再只是科幻设想，而是前沿 AI 公司正在认真对待的现实研究课题。

Clark 表示，基于目前公开的技术进展，他开始认为：那些长期被视为科幻题材的场景，可能正在转变为真实的技术趋势。如果这一趋势持续下去，人类社会的运行方式和治理结构，都可能面临深刻变化。

发表评论

登录后才可评论。去登录