Anthropic 于 2026 年 5 月 22 日公布了其在 4 月启动的网络安全项目 Project Glasswing 的初期进展。借助尚未公开的前沿 AI 模型 「Claude Mythos Preview」,该项目已经在全球关键软件中发现了超过一万项高危与严重级别的安全漏洞。
Project Glasswing 的目标,是在 AI 网络攻防能力迅速提升的背景下,抢在攻击者之前发现并修复关键软件中的安全弱点。Anthropic 与 Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks 等企业和组织合作,将 Claude Mythos Preview 以“防御用途优先、严格受控”的方式提供给合作伙伴使用。
约 50 家合作伙伴参与,Cloudflare 单独发现 2000 个缺陷
据 Anthropic 介绍,目前已有约 50 家合作伙伴 参与 Project Glasswing。在项目启动后的约 1 个月内,多数合作伙伴各自发现了 数百个 高危或严重级别的漏洞。一些机构反馈称,借助 Claude Mythos Preview,漏洞发现速度相比以往 提升了 10 倍以上。
在提供加速互联网与安全服务的美国公司 Cloudflare 的系统中,Claude Mythos Preview 共发现了约 2000 个缺陷,其中 400 个 被评估为高危或严重级别。Cloudflare 在其技术说明中表示,他们在 50 多个代码仓库 中引入 Claude Mythos Preview,将其嵌入代码审查与漏洞检测流程,用于验证其在真实工程环境中的效果。
Claude Mythos Preview 不仅能指出代码中疑似存在问题的片段,还被用于:
- 将多个看似独立的漏洞串联起来,推演出完整的攻击路径;
- 评估这些组合是否在现实中可被利用,并给出可行的利用方式验证。
Anthropic 指出,这类能力为防御方带来了显著优势,但一旦被攻击者滥用,潜在风险同样巨大。
扫描逾 1000 个开源项目,人力验证与修复成为瓶颈
过去数月中,Anthropic 还使用 Claude Mythos Preview 扫描了 1000 多个支撑互联网基础设施的开源项目。截至目前,模型共发现 23,019 条 潜在问题,其中被初步评估为高危或严重级别的漏洞有 6,202 条。

这些结果正由独立安全公司等第三方持续复核。Anthropic 表示,在向项目维护者正式通报之前,他们会经过以下步骤:
- 复现漏洞;
- 重新评估漏洞严重程度;
- 确认是否已存在修复;
- 为维护者撰写详细技术报告。
Anthropic 公布的在线仪表盘展示了从“模型发现候选问题”到“第三方安全机构确认”“向维护者报告”“完成修复”“发布安全公告”的完整流程。截止 2026 年 5 月 22 日,在 23,019 条候选问题 中:
- 1,596 条 已正式报告给维护者;
- 1,451 条 已被维护者确认;
- 97 条 已完成修复;
- 88 条 已发布公开安全公告。
这一巨大落差表明:AI 发现漏洞的能力大幅提升,但人工验证、修复与披露的流程却难以同步扩容,已成为新的瓶颈。Anthropic 透露,一些开源项目维护者曾主动请求放缓披露节奏,因为他们需要更多时间来完成修复。当前,高危与严重漏洞从被报告到修复完成,平均仍需 约两周时间。
Anthropic 还举例说明,Claude Mythos Preview 已成功发现开源加密库 「wolfSSL」 中的安全漏洞,并推动其完成修复与 CVE 编号登记。更详细的技术分析将在修复广泛部署之后再对外公开。
「Claude Mythos Preview」暂不面向公众开放
Claude Mythos Preview 是 Anthropic 尚未公开的前沿级模型,目前不对公众提供。Anthropic 在 Project Glasswing 启动时曾表示,该模型在发现软件漏洞与验证可利用性方面,整体水平已经 超越了许多经验丰富的人类安全专家。
英国的 AI Security Institute 评价称,Claude Mythos Preview 是首个在模拟多阶段网络攻击的“网络靶场”中,能够端到端完成整套攻防任务的模型。Anthropic 认为,未来具备类似能力的模型很可能会更广泛地出现,而目前尚未建立起足够成熟的安全防护与滥用防范机制,因此决定暂不向公众开放 Mythos 级别模型。
接下来,Anthropic 计划与包括美国及其盟国政府在内的关键合作伙伴进一步协作,扩大 Project Glasswing 的覆盖范围。同时,公司也将继续完善基于 公开版 Claude 模型 的漏洞检测与修复辅助工具,为更广泛的开发者与组织提供安全能力支持。
