Meta与Google等开放权重AI模型被曝可在数分钟内解除安全防护,暴露开放权重模式的安全隐患
AI安全公司Alice的研究显示,通过对模型内部“拒绝信号”进行技术性削弱,Meta、Google等多家厂商公开的安全训练版开放权重大模型,其针对钓鱼、化学武器、恶意软件生成等高风险请求的防护,可在数分钟内被绕过。
AI安全公司Alice的研究显示,通过对模型内部“拒绝信号”进行技术性削弱,Meta、Google等多家厂商公开的安全训练版开放权重大模型,其针对钓鱼、化学武器、恶意软件生成等高风险请求的防护,可在数分钟内被绕过。