Claude Mythos 与 Project Glasswing：一位“AI 超级黑客”为何敲响警钟

科学 2026-04-16 人工智能, 网络安全, Anthropic, 大型模型, 科技政策 40 次浏览

新一代、更强大的人工智能（AI）模型几乎以固定节奏问世：最新版本的 ChatGPT、Claude 或 Gemini 总会带来新功能和新能力，开发公司也积极鼓励用户尝试。然而，这一次 Anthropic 高调公布了一款新模型，却只向极少数用户开放。《纽约时报》将其形容为一个“令人恐惧的警示信号”，因为这款模型的能力远超以往。Anthropic 为此专门启动了名为 Project Glasswing 的计划，希望把这项技术牢牢用在防御而非攻击上。

原因在于，早期测试显示，这个名为 Claude Mythos 的模型在特定指令下，曾突破受控测试环境（“沙箱”），主动给一名研究人员发送电子邮件。这已经足以引发担忧。但更关键的是，Anthropic 声称 Mythos 能在“每个主流操作系统和每个主流网页浏览器”中发现软件漏洞和缺陷。

挖出深藏多年的漏洞

在一个典型案例中，Mythos 找到了 OpenBSD 中的一个安全漏洞。OpenBSD 是广泛用于防火墙和路由器的安全导向操作系统，而这个漏洞据称已经潜伏了 27 年。Anthropic 还表示，Mythos 发现了 FFmpeg 中一个存在 16 年之久的缺陷。FFmpeg 虽然对普通用户来说相对陌生，却是大量计算机、应用和网站处理音视频文件时依赖的底层组件。

此外，Anthropic 称 Mythos 在 Linux 内核中识别出多个漏洞，并能将这些问题串联利用，从而在理论上让攻击者获得对目标机器的完全控制权。公司内部评估一方面凸显了该模型在技术上的巨大潜力，另一方面也强调了必须保持高度警惕。

评估报告提出了一个假设风险：高级 AI 可能利用其在组织内部获得的访问权限实施攻击。不过，Anthropic 的结论是，Mythos 自主产生有害行为的概率极低，也就是说，它不太可能“自己失控”，但在有人类恶意指令时，确实可能被用来做坏事。

为何 Anthropic 要限制 Mythos 的开放

考虑到 Mythos 的能力和潜在风险，Anthropic 决定暂不向公众全面开放该模型。与之相伴，公司启动了 Project Glasswing 计划。

这一计划汇聚了微软、亚马逊、谷歌、苹果、思科、NVIDIA 等大型科技企业，Linux 基金会等开源组织，以及摩根大通等主要金融机构，目标是在网络防御领域优先使用 Mythos，而不是让类似能力首先落入攻击者之手。核心思路是：让防御方抢先一步，在攻击者利用同类 AI 工具之前，发现并修补关键软件中的安全弱点。

如何看待 Anthropic 释放的信息

AI 公司因担心模型过于强大而限制发布，并非首次出现。早在 ChatGPT 问世之前的 2019 年，OpenAI 就曾对当时的 GPT-2 模型采取谨慎发布策略。（现任 Anthropic CEO Dario Amodei 当时正是 OpenAI 的关键研究人员。）

这并不意味着当前的警示可以被轻易忽略。Anthropic 这次公布了相对罕见的技术细节。有报道指出，美国监管部门甚至曾召集多家大型银行 CEO 在华盛顿开会，专门讨论 Mythos 带来的网络风险。

不过，外界仍需保持一定审慎态度。Anthropic 表示，其发现的漏洞中超过 99% 尚未公开披露，因为尚未完成修补。这符合负责任披露的惯例，却也意味着公众必须在缺乏完整外部验证的情况下，对大量关键信息“先信后证”。

Mythos 对网络安全格局的冲击

网络安全事故会给个人带来切实后果。在澳大利亚，Optus 数据泄露事件暴露了约 950 万人的个人信息。另一宗 Medibank 数据泄露则涉及高度敏感的健康记录，其中部分数据后来被发布到暗网。

这些事件不仅是技术层面的数据库问题，更演变成隐私、身份与信任的系统性危机。这正是 Mythos 之类模型被视为关键转折点的原因。

Mythos 及类似 AI 工具，可能从根本上改变网络安全的“经济学”。过去，严重漏洞之所以能长期潜伏不被发现，是因为挖掘漏洞需要极高的专业技能、耐心和大量时间。而如果像 Mythos 这样的模型可以在前所未有的规模上扫描互联网的底层结构——包括操作系统、浏览器、路由器以及共享的开源代码——那么原本只有少数专业黑客才能完成的工作，可能被自动化、批量化地执行。

对各类组织和软件开发团队而言，Mythos 是一把典型的双刃剑。一方面，它能帮助快速发现自身代码中长期被忽视的隐患；另一方面，也带来一个现实威胁：攻击者可能更早利用类似工具找到并武器化这些漏洞。

影响范围远不止科技公司。许多关键但不显眼的软件系统支撑着人们日常依赖的基础服务，从电力、供水，到航空、银行、零售和医院等领域，都可能受到波及。

接下来会发生什么？

到目前为止，网络安全和软件行业对 Anthropic 的 Mythos 在公开场合保持了异常低调。许多公司似乎选择观望，避免过早表态，以免在讨论中暴露自身系统的潜在弱点。

然而，Mythos 的出现至少说明一件事：把网络安全当成“别人的问题”的时代正在结束。对普通个人而言，当前能做的应对其实很直接：坚持基本的网络安全习惯比以往任何时候都更重要。

及时更新手机、笔记本、浏览器和路由器的系统与固件。
更换已经停止获得安全更新的老旧设备。
使用密码管理器，避免重复和弱密码。
启用多因素认证（MFA）。
不要忽视系统和应用的安全补丁提示。

这些都是立刻可以采取的具体措施。更深层的难题则在于：在 AI 与网络安全交织的未来，谁能获得强大 AI 模型的访问权？谁来监管其使用？又由谁来界定什么样的机构或个人才算“合适的使用者”？

这些问题尚无定论，但 Mythos 和 Project Glasswing 已经让整个科技与金融体系开始正面面对它们。

本文转载自 The Conversation，依据知识共享许可协议发布。可查阅原文以获取更多背景信息。

发表评论

登录后才可评论。去登录