人工智能开发商Anthropic表示,正在调查一则有关其模型“Claude Mythos预览版”遭未授权访问的报告。该模型因被认为可能助长网络攻击而未向公众发布。
Anthropic是在彭博社周三报道称有一小群人获得该模型访问权限后作出回应的。Anthropic在声明中称:“我们正在调查一则报告,称通过我们的一家第三方供应商环境,未经授权访问了Claude Mythos预览版。”
彭博社报道,在Anthropic宣布将该模型提供给包括苹果和高盛在内的少数公司进行测试的同一天,一个私人在线论坛中的“少数”用户获得了对Mythos的访问权限。报道称,这些未具名用户利用其中一人作为Anthropic第三方承包商工作人员的访问权限,并采用网络安全研究人员常用的方法进入模型。
彭博社称,其通过截图及模型的实时演示进行核实,并表示该群体尚未在模型上运行网络安全相关提示,更倾向于“玩弄”这项技术,而非制造麻烦。

报道指出,这一潜在泄露仍可能引发监管层关注。此前有关当局已对Mythos可能带来的风险表达担忧,并由此引出如何防止潜在有害技术落入不当之手的问题。
英国人工智能部长Kanishka Narayan表示,英国企业“应该担忧”该模型识别IT系统缺陷的能力,因为黑客可能进一步利用这些缺陷。
Mythos已接受英国人工智能安全研究所(AISI)的审查。AISI上周警告称,Mythos在网络威胁能力方面较以往模型有“显著提升”。AISI表示,Mythos能够执行需要多步骤操作的攻击,并在无人干预情况下发现IT系统弱点,而这类任务通常需要人类专业人员耗时数天完成。
AISI还称,Mythos是首个成功完成其设计的32步网络攻击模拟的人工智能模型,在10次尝试中成功完成了3次挑战。
发表评论
登录后才可评论。
去登录