Claude Mythos 与 Project Glasswing:一位“AI 超级黑客”为何敲响警钟

新一代、更强大的人工智能(AI)模型几乎以固定节奏问世:最新版本的 ChatGPT、Claude 或 Gemini 总会带来新功能和新能力,开发公司也积极鼓励用户尝试。然而,这一次 Anthropic 高调公布了一款新模型,却只向极少数用户开放。《纽约时报》将其形容为一个“令人恐惧的警示信号”,因为这款模型的能力远超以往。Anthropic 为此专门启动了名为 Project Glasswing 的计划,希望把这项技术牢牢用在防御而非攻击上。

原因在于,早期测试显示,这个名为 Claude Mythos 的模型在特定指令下,曾突破受控测试环境(“沙箱”),主动给一名研究人员发送电子邮件。这已经足以引发担忧。但更关键的是,Anthropic 声称 Mythos 能在“每个主流操作系统和每个主流网页浏览器”中发现软件漏洞和缺陷。

挖出深藏多年的漏洞

在一个典型案例中,Mythos 找到了 OpenBSD 中的一个安全漏洞。OpenBSD 是广泛用于防火墙和路由器的安全导向操作系统,而这个漏洞据称已经潜伏了 27 年。Anthropic 还表示,Mythos 发现了 FFmpeg 中一个存在 16 年之久的缺陷。FFmpeg 虽然对普通用户来说相对陌生,却是大量计算机、应用和网站处理音视频文件时依赖的底层组件。

此外,Anthropic 称 Mythos 在 Linux 内核中识别出多个漏洞,并能将这些问题串联利用,从而在理论上让攻击者获得对目标机器的完全控制权。公司内部评估一方面凸显了该模型在技术上的巨大潜力,另一方面也强调了必须保持高度警惕。

评估报告提出了一个假设风险:高级 AI 可能利用其在组织内部获得的访问权限实施攻击。不过,Anthropic 的结论是,Mythos 自主产生有害行为的概率极低,也就是说,它不太可能“自己失控”,但在有人类恶意指令时,确实可能被用来做坏事。

为何 Anthropic 要限制 Mythos 的开放

考虑到 Mythos 的能力和潜在风险,Anthropic 决定暂不向公众全面开放该模型。与之相伴,公司启动了 Project Glasswing 计划。

这一计划汇聚了微软、亚马逊、谷歌、苹果、思科、NVIDIA 等大型科技企业,Linux 基金会等开源组织,以及摩根大通等主要金融机构,目标是在网络防御领域优先使用 Mythos,而不是让类似能力首先落入攻击者之手。核心思路是:让防御方抢先一步,在攻击者利用同类 AI 工具之前,发现并修补关键软件中的安全弱点。

如何看待 Anthropic 释放的信息

AI 公司因担心模型过于强大而限制发布,并非首次出现。早在 ChatGPT 问世之前的 2019 年,OpenAI 就曾对当时的 GPT-2 模型采取谨慎发布策略。(现任 Anthropic CEO Dario Amodei 当时正是 OpenAI 的关键研究人员。)

这并不意味着当前的警示可以被轻易忽略。Anthropic 这次公布了相对罕见的技术细节。有报道指出,美国监管部门甚至曾召集多家大型银行 CEO 在华盛顿开会,专门讨论 Mythos 带来的网络风险。

不过,外界仍需保持一定审慎态度。Anthropic 表示,其发现的漏洞中超过 99% 尚未公开披露,因为尚未完成修补。这符合负责任披露的惯例,却也意味着公众必须在缺乏完整外部验证的情况下,对大量关键信息“先信后证”。

Mythos 对网络安全格局的冲击

网络安全事故会给个人带来切实后果。在澳大利亚,Optus 数据泄露事件暴露了约 950 万人的个人信息。另一宗 Medibank 数据泄露则涉及高度敏感的健康记录,其中部分数据后来被发布到暗网。

这些事件不仅是技术层面的数据库问题,更演变成隐私、身份与信任的系统性危机。这正是 Mythos 之类模型被视为关键转折点的原因。

Mythos 及类似 AI 工具,可能从根本上改变网络安全的“经济学”。过去,严重漏洞之所以能长期潜伏不被发现,是因为挖掘漏洞需要极高的专业技能、耐心和大量时间。而如果像 Mythos 这样的模型可以在前所未有的规模上扫描互联网的底层结构——包括操作系统、浏览器、路由器以及共享的开源代码——那么原本只有少数专业黑客才能完成的工作,可能被自动化、批量化地执行。

对各类组织和软件开发团队而言,Mythos 是一把典型的双刃剑。一方面,它能帮助快速发现自身代码中长期被忽视的隐患;另一方面,也带来一个现实威胁:攻击者可能更早利用类似工具找到并武器化这些漏洞。

影响范围远不止科技公司。许多关键但不显眼的软件系统支撑着人们日常依赖的基础服务,从电力、供水,到航空、银行、零售和医院等领域,都可能受到波及。

接下来会发生什么?

到目前为止,网络安全和软件行业对 Anthropic 的 Mythos 在公开场合保持了异常低调。许多公司似乎选择观望,避免过早表态,以免在讨论中暴露自身系统的潜在弱点。

然而,Mythos 的出现至少说明一件事:把网络安全当成“别人的问题”的时代正在结束。对普通个人而言,当前能做的应对其实很直接:坚持基本的网络安全习惯比以往任何时候都更重要。

  • 及时更新手机、笔记本、浏览器和路由器的系统与固件。
  • 更换已经停止获得安全更新的老旧设备。
  • 使用密码管理器,避免重复和弱密码。
  • 启用多因素认证(MFA)。
  • 不要忽视系统和应用的安全补丁提示。

这些都是立刻可以采取的具体措施。更深层的难题则在于:在 AI 与网络安全交织的未来,谁能获得强大 AI 模型的访问权?谁来监管其使用?又由谁来界定什么样的机构或个人才算“合适的使用者”?

这些问题尚无定论,但 Mythos 和 Project Glasswing 已经让整个科技与金融体系开始正面面对它们。

本文转载自 The Conversation,依据知识共享许可协议发布。可查阅原文以获取更多背景信息。


分享:


发表评论

登录后才可评论。 去登录