Anthropic 发布新一代 AI 基础模型「Claude Mythos Preview」,因高危漏洞挖掘能力暂不向公众开放
Anthropic 公布前沿 AI 模型 Claude Mythos Preview 的技术细节。该模型在自动发现和利用软件漏洞方面表现远超以往模型,已能在部分场景下超过人类专家。出于安全考量,Anthropic 决定不向公众开放该模型,并启动 Project Glasswing 计划,将类似能力用于防御方的安全研究。
Anthropic 更新前沿 AI 安全指引:仅在“明显领先”时才考虑放缓开发
Anthropic 将其前沿 AI 安全框架 RSP 更新至 3.0 版,把“是否放缓开发”与自身在行业中的领先程度以及竞争对手的能力与安全措施挂钩,并新增定期公开风险评估报告等透明度机制。