Anthropic称最新AI模型可高效发现软件漏洞,出于安全担忧暂不向公众开放

richlovec 1500_400 (1)
 

Anthropic周二表示,其尚未发布的人工智能模型Claude Mythos在识别软件漏洞方面表现出很强能力。该公司称,Mythos已在数千款常用应用中发现漏洞,其中不少尚无补丁或修复方案。出于可能助长大规模黑客攻击的担忧,Anthropic决定暂不向公众发布该模型,并与网络安全领域合作伙伴推进防御性应用。

Anthropic Labs的Mike Krieger在旧金山举行的HumanX AI大会上表示,公司“有一个新模型,明确不会向公众发布”。他称,Anthropic正与网络安全专家及开源社区工程师合作,让Mythos用于防御场景,以便在风险扩大前“提前武装”相关人员。

Anthropic指出,随着AI模型编码能力提升,外界对黑客借助此类工具破解密码或攻破用于保护数据的加密技术的担忧加剧。该公司称,Mythos发现的最早漏洞可追溯至27年前,在被模型定位之前,其制造者并未察觉。

Mythos是Anthropic Claude系列AI的最新一代。Anthropic称,近期部分代码泄露促使公司发布博客文章,提示该模型可能带来“前所未有的网络安全风险”。Anthropic在博客中表示,AI模型的编码能力已达到一种水平,能够在发现并利用软件漏洞方面超越除最顶尖人类之外的所有人,其对经济、公共安全和国家安全的影响可能“极为严重”。

Anthropic还表示,Mythos揭露的漏洞往往细微且难以察觉。该公司举例称,模型发现了一处此前未被注意到的视频软件缺陷,而该软件已被开发者测试超过500万次。

作为预防措施,Anthropic已将Mythos的一个版本分享给网络安全公司CrowdStrike和Palo Alto Networks,以及亚马逊、苹果和微软,并启动名为“Glasswing”的项目。Anthropic称,思科和博通也参与其中,Linux基金会亦加入该项目。

在关于Glasswing的联合声明中,思科首席安全与信任官Anthony Grieco表示,这项工作“太重要、太紧迫,无法单独完成”。他称,AI能力已跨越门槛,改变了保护关键基础设施免受网络威胁所需的紧迫性。

据介绍,约有40个涉及计算机系统设计、维护或运营的组织加入Glasswing。Anthropic表示,项目合作伙伴将共享通过Mythos发现的成果,Anthropic为此提供约1亿美元的计算资源。Grieco称,早期合作显示,AI模型能够以前所未有的速度和规模帮助发现并修复软硬件漏洞。

CrowdStrike首席技术官Elia Zaitsev表示,从漏洞被发现到被对手利用的时间窗口正在缩短,“过去需要数月,现在借助AI几分钟内即可发生”。他补充称,“Claude Mythos Preview展示了防御者在大规模防护中现已可能实现的能力,而对手不可避免地会试图利用同样的能力”。

Anthropic还表示,尽管白宫今年2月下令终止与该初创公司的所有合同,但公司仍与美国政府就Mythos进行了讨论。该指令因Anthropic提出法律挑战而被联邦法官暂时搁置,相关案件仍在审理中。


分享:


发表评论

登录后才可评论。 去登录