Anthropic CEO:预计中国AI模型在6〜12个月内追上Mythos,呼吁尽快修复未披露漏洞

美国AI公司 Anthropic 的首席执行官达里奥·阿莫代伊(Dario Amodei)于 2026 年 5 月 5 日(当地时间)在面向金融行业的活动 “The Briefing: Financial Services{target="_blank"}” 上,详细介绍了该公司 AI 模型「Claude Mythos Preview」在网络安全领域展现出的能力与风险。

阿莫代伊表示,美国主要 AI 实验室可能会在 1〜3 个月内、中国的 AI 模型则可能在 6〜12 个月内追上 Mythos 目前展现出的安全能力。因此,必须利用这段时间窗口,尽快修复 Mythos 已经发现但尚未公开的大量安全漏洞。

@YouTube

中国模型被认为“落后 6〜12 个月”,未修复漏洞需在窗口期内完成加固

在活动现场,嘉宾围绕 Mythos 带来的网络安全风险展开讨论。主持人提出疑问:如果模型能够大规模发现系统漏洞,那么这种能力本身是否会为攻击者打开新的大门?

阿莫代伊回应称,不仅是 Anthropic,自家以外的其他公司模型以及未来可能出现的开源模型,也有望在不久的将来具备类似能力。他判断,美国主要 AI 实验室大约只会落后 1〜3 个月,而中国的 AI 模型大约会落后 6〜12 个月。

正因为存在这样一个时间差,他强调,Anthropic 需要在这段时间内尽可能修复由 Mythos 发现的大量漏洞。如果在漏洞尚未修补的情况下就公开细节,将极有可能被攻击者利用,因此目前选择暂不披露具体技术信息。

阿莫代伊透露,Anthropic 目前已经识别出“数万条”安全漏洞,其中绝大部分仍未完成修复。以 Firefox 为例,Anthropic 已协助修复了约 300 个漏洞,但整体上仍有大量问题尚待处理。

他认为,如果能在未来 6〜12 个月内采取恰当措施,就有机会在攻击者获得同等能力之前,先一步修补这些缺陷,从而将整个软件生态推向更安全的状态。阿莫代伊还指出,借助 Mythos 这类模型,从软件设计阶段起就可以编写更安全的代码,而不是事后被动打补丁。

Anthropic:Mythos 能发现并利用主流操作系统与浏览器的零日漏洞

2026 年 4 月 7 日,Anthropic 的红队(Anthropic Red Team)发布公告{target="_blank"}称,尽管 Claude Mythos Preview 仍是一款通用语言模型,但在计算机安全任务上展现出了“极高水平”的能力。

根据 Anthropic 的说法,Claude Mythos Preview 已经展示出在主流操作系统和主流 Web 浏览器中,自动发现并利用零日漏洞的能力。由于其中超过 99% 的漏洞尚未修复,Anthropic 目前没有公开这些漏洞的技术细节。

在对外公布的案例中,Claude Mythos Preview 自主发现并利用了 FreeBSD NFS 服务器中的一个远程代码执行漏洞。该漏洞已经潜伏了长达 17 年,却一直未被发现,直到被 Mythos 挖掘出来。

为了让这类能力更多地服务于防御方,Anthropic 启动了名为 Project Glasswing{target="_blank"} 的项目,目标是系统性地发现并修复关键软件中的安全漏洞。参与该项目的合作伙伴可以获得对 Claude Mythos Preview 的访问权限,用于安全测试和加固。

通过 Project Glasswing 限量开放,优先让防御方“抢跑”修复

目前,Anthropic 并未将 Claude Mythos Preview 面向公众全面开放,而是通过 Project Glasswing 以受控方式、限量提供给特定合作伙伴。公司解释称,希望在具备类似能力的模型广泛流通之前,让防御方先一步完成对关键系统的加固。

阿莫代伊在活动中也强调,必须谨慎决策 Mythos 的开放范围。如果一次性向大量组织开放,风险会急剧上升;但如果开放过慢,又可能错失在攻击者获得同等能力前完成修复的机会。

他表示,Anthropic 的长期目标是在建立起足够的安全措施和治理机制后,逐步扩大 Mythos 的可用范围。公司正在与政府部门保持沟通,讨论分阶段开放流程、访问控制以及相应的“护栏”设计。

金融行业活动上同步发布面向金融服务的 AI 代理方案

在同一场活动中,Anthropic 还介绍了面向金融服务行业的 AI 代理(AI Agent)应用场景。活动开场时,Anthropic 金融服务负责人乔纳森·佩洛西(Jonathan Pelosi)登台表示,现场聚集了来自全球主要金融服务机构的 CEO、CTO、CIO 等高管。

Anthropic 当天发布了 10 种面向金融服务的 AI 代理模板,覆盖路演材料制作(Pitch)、会议准备、估值审查、DCF 建模等多类耗时的金融业务工作,旨在帮助机构提升效率。

活动中还宣布,Claude 已正式在 Excel、PowerPoint、Word 中提供通用服务,并以测试版形式登陆 Outlook。Anthropic 认为,这将使同一个 Claude 模型可以贯穿金融机构的完整办公与业务流程。

根据 Anthropic 的官方说明,这些代理模板可在 Claude Cowork、Claude Code、Claude Managed Agents 等产品中使用,公司也在推进与金融数据提供商及各类业务应用的集成。

跨过“危险时刻”后,有望迈向更安全的软件生态

阿莫代伊将当前阶段形容为一个“危险的瞬间”:一方面,强大的漏洞挖掘能力已经出现;另一方面,防御体系尚未完全跟上。如果处理不当,短期内风险可能显著上升。

不过,他同时强调,如果在这一关键窗口期内完成必要的修复和制度建设,就有机会把现有软件中的大量历史遗留问题一并解决,从而迈向更安全的整体环境。

Anthropic Red Team 也持类似观点:短期内,随着这类模型的能力扩散,确实会带来过渡期风险;但从长期看,防御方可以系统性地利用这些模型,在新代码发布前就提前发现并修补漏洞,将安全防线前移。


分享:


发表评论

登录后才可评论。 去登录