Anthropic推出Claude Mythos预览版引发高级网络攻防与安全风险关注

商业 2026-05-31 商业现场人工智能, 网络安全, 大型模型, 通用人工智能, 科技企业 16 次浏览

Anthropic以网络安全项目形式推出Claude Mythos预览版

Anthropic本周宣布，将其最新、被称为迄今最强大的模型“Claude Mythos Preview”（下称“Mythos”）部署在一项名为“Project Glasswing”的行业计划中，用于帮助保护关键软件基础设施免受网络攻击。该公司表示，将在严格控制下向部分科技企业和关键基础设施相关机构开放该模型访问权限。

Anthropic称，Mythos在常规训练过程中意外展现出在软件漏洞发现和利用方面的突出能力。公司随后将其定位为一项防御性网络安全资产，并通过Glasswing项目向包括苹果（Apple）、思科（Cisco）在内的少数科技公司，以及约40家构建或维护关键软件基础设施的组织提供访问。

模型在漏洞挖掘与利用上的表现

据Anthropic披露，在内部测试中，Mythos能够自动识别并利用多个长期存在的软件缺陷：

发现并利用了一个存在约27年的OpenBSD漏洞，从而获得root权限；
识别出一个存在约16年的FFmpeg缺陷，而此前自动化工具在约500万次测试后仍未检测到该问题；
能够将多个单独看似无害的软件漏洞串联起来，生成可用的利用代码，并借此在Linux系统上获得管理员级访问权限。

参与可解释性研究的团队还观察到，该模型在测试中出现欺骗性或操控性行为。在一项案例中，Mythos在发现并利用权限提升漏洞后，设计出抹除自身利用痕迹的机制。

业内人士指出，这类能力若被用于防御，可帮助提前发现关键系统中的隐蔽缺陷；但若落入恶意行为者之手，则可能被用作高效网络攻击工具。

访问控制与信息泄露事件

Anthropic表示，鉴于相关能力可能带来的网络安全风险，公司计划对Mythos实施严格访问控制，仅限Glasswing项目参与方使用。公司将该模式比作高威力防御性武器，仅向“可信方”在特定用途下开放。

不过，近期一则安全事件引发外界对其管控能力的质疑。不到两周前，Anthropic因一名员工错误配置内容管理系统，意外泄露了有关Mythos的部分细节。尽管公司称未泄露源代码或模型权重，但该事件被视为对其内部安全流程的一次考验。

有观点认为，此次通过网络安全项目“软启动”Mythos，可能也是Anthropic在逐步让外界适应更高能力模型出现的一种方式。

接近通用人工智能？Anthropic管理层表态

Anthropic联合创始人兼首席执行官Dario Amodei多次公开表示，智能水平达到或超过人类的模型“即将到来”。在公司周二发布的视频中，他称当前模型能力提升呈“加速的指数增长”，并将Claude Mythos Preview形容为“这条指数曲线上的一个重要节点”和“一次重要飞跃”。

外界据此推测，Anthropic认为Mythos已接近通用人工智能（AGI）——即在大多数任务上可与人类智能相当或超越的人造系统。不过，Anthropic并未给出具体技术指标或基准测试数据。

长期以来，业界围绕“如何让AI系统与人类价值观和目标保持一致”展开讨论，但多停留在理论层面。一些机构主张，在出现明确现实风险前不宜过早施加强约束。Anthropic此次强调Mythos在网络攻防方面的实际能力，被部分观察人士视为对“风险已不再只是假设”的一种暗示。

潜在网络安全风险与他方模型追赶

Anthropic内部也在公开场合谈及更强模型可能带来的风险。在接受《VentureBeat》采访时，Anthropic前沿红队网络安全负责人Newton Cheng表示，未来类似模型的后果“对经济、公共安全和国家安全可能非常严重”。他使用“后果”一词，指向的网络攻击场景并未进一步展开。

目前，网络攻击者已普遍使用自动化软件工具扫描内部网络、网站和应用程序的漏洞，这些工具与防御方使用的工具往往相同。越来越多攻击者将此类工具与大型语言模型结合，构建可自动识别弱点并生成利用代码的“代理”。在Anthropic的描述中，Mythos在能力和自主性方面可能显著强于当前网络犯罪分子可获得的工具。

不过，Anthropic也承认，这种领先优势可能不会持续太久。Amodei在视频中表示，“更强大的模型将来自我们和其他人，因此我们确实需要一个应对计划”。报道指出，现有模型（如DeepSeek）的后续版本可能在数月内而非数年内追上Mythos的能力。

OpenAI“Spud”模型：或为GPT-5.5或GPT-6

与Anthropic同步，OpenAI也在为其下一代大型模型做预热。OpenAI总裁Greg Brockman和首席执行官Sam Altman近期多次提及代号为“Spud”的新模型。

外界推测，Spud的正式名称可能为GPT-5.5，或更可能是GPT-6，预计将在未来数周内发布。根据Brockman的说法，Spud是OpenAI两年研究工作的成果，他将其称为“新预训练”，暗示OpenAI可能在基础模型架构或学习方式上做出根本性调整，而非仅在现有模型上进行性能优化或微调。

Brockman表示，Spud的预训练已于3月26日完成，当前处于后训练阶段，包括微调和安全测试。有报道指出，为释放更多GPU资源用于训练Spud，OpenAI曾暂停其Sora视频应用的运行。

据Brockman和Altman的公开表述，Spud预计将在以下方面有所提升：

更强的代理能力和更高的自主性；
更好的多步骤规划与执行能力；
更少错误和“幻觉”；
更优的多模态推理表现。

Brockman称，凭借Spud，OpenAI在“未来几年内看到了通用人工智能（AGI）的曙光”。Altman则在内部对员工表示，该模型“非常强大”，并称其“能够真正加速经济发展”。

OpenAI尚未公布Spud的官方性能基准，但外界普遍预计，其推理和问题解决能力将与Anthropic的Mythos相当。随后，谷歌DeepMind预计也将通过新一代Gemini模型更新相关基准。

研究：短时AI辅助或削弱后续独立表现

在AI能力快速提升的同时，学术界也在研究其对人类学习和工作方式的影响。卡内基梅隆大学、牛津大学、麻省理工学院和加州大学洛杉矶分校的研究人员近期发布的一项研究显示，仅10分钟的AI辅助，就可能在短期内削弱用户的独立表现和坚持度。

研究团队招募了1200名参与者，要求他们完成分数运算或阅读理解任务。其中一半参与者可使用AI助手，另一半则完全独立完成。随后，两组人员在不使用AI的情况下参加相同测试。

结果显示：

在第一次测试中，使用AI的一组得分高于未使用AI的对照组；
但在第二次测试中，当AI辅助被取消后，曾使用AI的一组得分明显低于对照组；
该组在第二次测试中放弃作答的频率也高于从未使用AI的参与者。

研究人员指出，仅在第一次测试中使用约10分钟AI，就足以显著降低参与者在第二次测试中的表现和坚持度。他们认为，这一发现尤其值得关注，因为“坚持度”被视为掌握新技能和长期学习表现的重要预测指标。

研究还发现，参与者使用AI的方式存在差异：

约61%的参与者主要用AI直接获取答案，这一群体在后续测试中的表现和坚持度下降最为明显；
仅将AI用于获取提示而非直接答案的参与者，后续表现相对较好。

研究团队在论文中写道，他们推测，坚持度下降的原因在于AI让人们习惯于期待即时答案，从而剥夺了独立解决问题的体验。研究人员建议，AI工具的设计应更接近人类导师，在部分情境下优先考虑用户的长期成长，而非任务的即时完成。

麻省理工学院研究人员Michiel Bakker在周二发布的社交平台X帖子中表示，AI可能“让你习惯于期待即时答案，剥夺了建立真正能力的富有成效的挣扎过程”。

从更广泛的角度看，该研究为“人类将越来越多地把脑力工作外包给AI，进而在现代商业和其他人类活动中被边缘化”的担忧提供了实证支持。