Anthropic本月公布其最新人工智能模型“Claude Mythos”,并表示不会对外公开发布。该公司称,该模型具备发现此前未知“零日”漏洞、利用漏洞并将多个弱点串联的能力,理论上可接管主要操作系统和网页浏览器。Anthropic表示,Mythos可自主完成相关操作,包括编写代码并获取权限。
为应对潜在风险,Anthropic在“玻璃翼计划”框架下指定了40个合作组织,目标是在黑客利用漏洞之前完成修补。报道指出,这些合作方均为美国机构,处于美国主导的数字体系核心。除美国外,Anthropic仅与英国共享Mythos,允许英国人工智能安全研究所对前沿模型进行测试。英国部长在近距离观察后警告称,人工智能将使网络攻击更容易、更迅速,而多数企业尚未做好准备;欧洲银行可能成为下一批测试对象。
与此同时,本周出现未经授权访问的相关报告,进一步引发外界对“是否应由私营公司掌握此类能力”的讨论。相关观点认为,Mythos未必创造了全新的网络威胁类型,但可能将原本分散的潜在弱点转化为系统性风险。传统网络入侵往往门槛高、耗时长,依赖少数具备专业技能的人员;而人工智能工具的普及正在降低门槛,使系统入侵更易被规模化实施。
不过,人工智能也可能用于提升防御能力。Mozilla在Firefox浏览器上测试Mythos后称,其发现的漏洞数量是以往的十倍,并已完成修复。相关表述同时强调,这些漏洞并非人类无法发现,变化主要在于人工智能能够以更快、更低成本、更大规模的方式发现网络弱点。

报道还提到,美国政府对Anthropic态度出现变化。今年2月,五角大楼曾将该公司视为“安全风险”,并在其拒绝允许技术用于大规模监控或自主武器后,切断了其盈利合同,合同随后转授OpenAI。Anthropic长期以Claude聊天机器人将自身定位为更强调伦理的竞争者,但其形象曾因去年15亿美元的盗版和解而受损。
围绕Mythos的能力边界也存在争议。有研究人员指出,规模化部署的更小、更廉价模型也能完成类似任务,Mythos被视为“突破”的表现可能反映了行业整体趋势。与此同时,白宫被指认为Anthropic具有战略价值,并邀请其重新加入相关体系,显示出从将人工智能公司视为承包商向合作伙伴的转变。相关讨论由此延伸至更深层问题:在技术扩散背景下,由私营公司掌握关键基础设施相关能力是否合适。
在更广泛层面,相关观点认为,缺乏国际网络安全协调框架可能带来新的结构性风险:互联网可能走向多个相互竞争的体系,各自修补自身系统并对外部缺乏信任,从而削弱互联网作为全球共享公共资源的属性。