人工智能跨入新阶段:Claude Mythos将如何重塑网络安全

人工智能跨过新门槛

前沿人工智能的能力已经迈入新阶段:在极少人类指导下,AI如今可以以远超人类的速度,策划并执行复杂的网络行动。

这一点在美国科技公司 Anthropic 开发的 Claude 系列中最新、最强的模型——Claude Mythos Preview 的独立测试中得到验证。与 ChatGPT 类似,这类系统能够理解和生成类人文本,分析复杂信息,并解决高难度问题。

金融行业的震动

金融业对此尤为紧张。该行业高度依赖互联的数字基础设施,而这些系统极易成为复杂网络攻击的目标。一旦遭到成功入侵,可能导致支付系统中断、资金访问受阻,并削弱公众对银行体系的信任。

目前,英美多家大型银行正计划在严格管控下开展受控试验。他们将在隔离环境中以安全、受监督的方式接入 Mythos Preview,用于评估其发现系统漏洞的能力,同时尽量压缩被滥用的风险。这种做法类似在高安全级别实验室中研究危险病毒。

“最后一道关卡”测试

英国政府科学、创新与技术部下属的人工智能安全研究所,已在一套名为 “The Last Ones” 的严苛基准测试中评估了 Mythos Preview。顾名思义,这组挑战被设计为:在AI被视为能够从头到尾完全自动化复杂现实网络攻击之前,必须跨越的最后一道门槛。

在受控环境下,Mythos Preview 自主发现了数千个“零日”漏洞——即连软件开发者自身都不知情的缺陷,覆盖所有主流操作系统和常用网页浏览器。其中部分漏洞在软件被反复审查数百万次的情况下,仍然潜伏了长达 27 年之久。

在同样的测试中,熟练的人类操作员通常需要约 20 小时才能完成。而在十次独立运行中,Mythos 有三次实现了完整成功,使这一预览版成为首个能端到端打通整个攻击链的 AI 模型。

这些结果表明,AI 已能真正自主地串联起复杂的连续操作。Mythos Preview 因此代表着 AI 作为“自主代理”的一次重大飞跃:它可以在极少人类干预下,规划并执行多步骤的复杂任务。

从助手到自主操作者

这一技术突破的意义远不止网络攻击。同样的能力,很快可能被用于让 AI 自主管理软件开发、科学研究、供应链调度或金融操作。Mythos Preview 标志着 AI 正从“强大助手”转向“真正的自主操作员”,对多个行业的运行方式产生深远影响。

双重用途的两难

目前,Anthropic 尚未公开发布该模型,而是通过名为 Project Glasswing 的项目对其进行限制性开放,仅向苹果、谷歌、微软、思科、亚马逊等少数科技巨头及关键基础设施运营方提供受控访问。

Anthropic 的明确目标是“保护世界上最关键的软件”:在操作系统、浏览器和关键软件库中,尽可能提前发现并修复安全弱点。这些软件构成了几乎所有现代数字系统的基础。只有在完成这一轮防御性工作后,Mythos 才可能作为通用 AI 系统更广泛部署。

传统的漏洞管理,是一个识别、评估并修补软件和系统弱点的过程,以防被攻击者利用。这通常需要大量专家投入,进展缓慢且成本高昂。Mythos 的出现,可能从根本上改变这一流程——既可能带来巨大利好,也可能引入新的风险。

这正是典型的“双重用途”困境:同一项技术突破,既能显著增强防御能力,也可能降低进攻门槛。

从积极面看,类似 Mythos 的模型可以以前所未有的速度和规模,发现并修补大量未知漏洞,大幅提升关键软件的整体安全性,缩短攻击者可利用的时间窗口。

许多当前常见的网络犯罪,如勒索软件攻击,依赖利用已知或容易被发现、但尚未修补的系统漏洞。如果防御方普遍采用 Mythos 级别的模型进行漏洞扫描,这类攻击的成功率可能明显下降。

但更复杂或高度定向的勒索软件攻击——尤其是依赖被盗凭证、社会工程或已被攻破账户的攻击——受影响会较小,因为它们往往绕过传统意义上的软件漏洞。

从消极面看,同样的能力也可能显著降低恶意行为者的技术门槛,使其比人类团队更快地发现并串联漏洞。一旦这类技术脱离受控环境,将极大加速复杂网络攻击的策划与执行。

目前尚无公开证据表明犯罪组织或敌对国家已获得 Mythos Preview。但从网络安全技术发展史来看,资金和资源充足的行为体——无论是国家支持的组织,还是大型犯罪集团——在不远的将来很可能自行开发出类似系统,或通过间接途径获取访问能力。

网络安全的下一阶段

在短期内,各国政府很可能会修订网络安全规范和事件响应流程,将强制性的 AI 辅助漏洞扫描纳入标准要求。这意味着组织需要持续使用 AI 对系统进行扫描,而不再仅依赖间歇性的人为检查。

这有望通过更快发现缺陷来显著提升整体安全性,但也可能推高运营成本,并带来系统性能下降、误报增多,或在修复过程中出现短暂业务中断等问题。

网络保险公司几乎可以肯定会将此类 AI 防御措施列为承保前提条件,从而推高保险费用。同时,关键基础设施运营商也将加速部署自动化监控与响应系统。这一趋势不仅会影响银行和金融机构,也将波及能源、医疗、通信、交通等所有关键基础设施领域。

当然,Mythos 并不是终点。Anthropic 以及其他领先 AI 公司正在研发下一代模型,目标是打造高度自主的 AI 代理,能够独立规划、调整并执行长时间、复杂的任务序列。除了发现漏洞,这类系统还可能负责协调大规模行动,或管理复杂的现实工作流程——几乎无需人类持续介入。

治理与合作的紧迫性

在这一节点上,既需要紧迫感,也需要审慎态度。稳健的治理框架、国际间的协作,以及对防御性应用的持续投入,将变得至关重要。

技术“魔瓶”已经打开,接下来的关键在于:如何确保这股力量更多地服务于安全与稳定,而不是被推向混乱与破坏。

本文依据 The Conversation 原文内容改写,遵循其知识共享许可协议。


分享:


发表评论

登录后才可评论。 去登录