Anthropic 推迟发布其新一代 AI 模型 Claude Mythos。这款模型被描述为拥有极强的编程能力,可能成为黑客手中的强力工具,由此在业界引发了既警惕又怀疑的复杂反应。
Anthropic 是当前激烈 AI 竞赛中的重要参与者之一。对自家技术“危险性”和“颠覆性”的高调宣传,有助于其在商业上抢占关注度,也被视为为传闻中的即将上市预热造势。
企业家兼投资人、大卫·萨克斯(David Sacks)——他同时领导唐纳德·特朗普总统的技术顾问委员会——公开表示:“世界别无选择,只能认真对待与 Mythos 相关的网络威胁。”
但他也补充称,“很难忽视 Anthropic 过去使用恐吓策略的历史。”
围绕 Mythos 的讨论,集中在一个核心担忧上:黑客可能借助 AI 代理大军,轻松突破各类计算机防御系统。
在本周于旧金山举行的 HumanX AI 大会上,专注 AI 安全的初创公司 Corridor 的亚历克斯·斯塔莫斯(Alex Stamos)承认,基于代理的自动化黑客攻击确实是现实威胁。
同时,他也不忘调侃自己口中的 Anthropic“营销噱头”。
谈到这家总部位于旧金山的公司时,斯塔莫斯说:“他们做了一堆可爱的小卡通,讲这些产品危险到不可思议,以至于他们甚至不让人们用。”
“这就好像曼哈顿计划是通过一篇可爱的《卡尔文与霍布斯》漫画来宣布核弹一样。”
据周五报道,美国最大银行的负责人本周与美联储主席杰罗姆·鲍威尔以及财政部长斯科特·贝森特会面,讨论尚未正式发布的 Claude Mythos 可能带来的安全影响。
Cato Networks 联合创始人兼首席执行官施洛莫·克莱默(Shlomo Kramer)在一篇博客文章中写道:“Mythos 模型指向的远不止人工智能的又一次飞跃。”
“它标志着一种转变,可能重新定义网络空间中攻击者与防御者之间的力量平衡。”
本周,在名为 Project Glasswing 的计划下,Mythos 的严格受限预览版已向部分合作伙伴开放。这些合作伙伴包括亚马逊、苹果、微软、谷歌、思科、CrowdStrike 和摩根大通等。
据 Anthropic 及其合作伙伴介绍,Mythos 能够自主扫描海量代码,在不同软件之间串联起此前未知的安全漏洞,覆盖范围从操作系统到网页浏览器。

关键在于,他们警告说,这种扫描的速度和规模远超人类能力,这意味着它理论上可以在数小时内瘫痪银行、医院或关键国家基础设施。
施洛莫指出:“过去只有顶尖专家才能完成的工作,现在可以由软件代理来执行。”
“直接后果将是漏洞发现数量激增,一场真正的‘海啸式’利用已知和未知漏洞的浪潮。”
“代理对代理战争”
在 HumanX 大会上,与会者普遍认同:已经具备强大编程能力的 AI 代理,在挖掘软件弱点方面必然会表现突出。
斯塔莫斯认为:“我们已经不再处于一个只有人类能写代码的时代,因为我们拥有超人类(AI 模型),它们会在代码中发现漏洞。”
“人类单靠自己根本不可能做到这一点。”
他预测,未来的网络安全格局将演变为:人类负责监督防御性 AI 代理,而攻击方同样利用类似技术发动入侵。
斯塔莫斯将这种局面称为“代理对代理战争”,人类则在一旁提供策略和指导。
网络安全公司 Palo Alto Networks 的温迪·惠特莫尔(Wendy Whitmore)预计,今年内可能会发生一次与 AI 代理能力直接相关的“某种灾难性攻击”。
“让我夜不能寐的是,我们正面临 AI 将发现大量新漏洞的巨大冲击,”CrowdStrike 的亚当·迈耶斯(Adam Meyers)表示。
迈耶斯认为,将小型 AI 模型直接嵌入恶意代码、随感染在网络中扩散,是黑客几乎必然会尝试的路径。
“终极武器将是不再依赖预编程行为的恶意软件,”迈耶斯说。
“它可以执行你要求它做的任何事情。”
© 2026 AFP