Anthropic推出Claude Code自动模式 在安全约束下提升自主执行能力

对于使用AI开发工具的开发者而言,在代码生成和执行过程中,通常需要在逐项人工审批与放任模型自主运行之间作出取舍。Anthropic近日表示,其针对Claude Code的最新更新试图改变这一状况,让模型在一定范围内自行判断哪些操作可以安全执行,同时保持必要的限制。

据介绍,此次新增的“自动模式”(Auto Mode)目前处于研究预览阶段,可供测试但尚未作为正式产品发布。该模式体现了业内一项更广泛趋势:AI工具正被设计为在更少人工干预的前提下执行任务,以提高开发效率。然而,在速度与控制之间取得平衡仍被视为关键难点——限制过多可能影响效率,而限制过少则可能增加系统风险和不可预测性。

Anthropic称,自动模式在每次操作执行前会调用内置的AI安全机制,对即将执行的行为进行审查。系统会检查是否存在用户未请求的高风险行为,以及是否出现提示注入迹象。提示注入是一类攻击方式,通过在AI处理的内容中嵌入恶意指令,引导其执行非预期操作。根据审查结果,被判定为安全的操作将自动执行,而被视为存在风险的操作则会被阻止。

公司表示,这一功能可被视为Claude Code中现有“dangerously-skip-permissions”命令的延伸。后者将决策权几乎完全交由模型,但自动模式在此基础上叠加了安全审查层,试图在自主性与安全性之间增加一道防线。

自动模式建立在近期一系列自主编码工具的基础之上。此前,GitHub、OpenAI等公司已推出可代表开发者执行部分任务的工具。与这些产品相比,Anthropic此次更新进一步将“何时需要请求用户许可”的判断权部分交由模型自身完成。

目前,Anthropic尚未公开说明其安全层用于区分安全操作与风险操作的具体标准。业内观察人士认为,开发者在大规模采用该功能前,可能会关注相关细节。报道提到,TechCrunch已就此向Anthropic寻求更多信息。

在自动模式之前,Anthropic已推出Claude Code Review工具,用于在代码进入代码库前自动审查并发现潜在漏洞;以及Dispatch for Cowork功能,允许用户将任务分派给AI代理代为处理。

Anthropic表示,自动模式将在未来几天内向企业用户和API用户陆续开放。目前,该功能仅支持Claude Sonnet 4.6和Opus 4.6两个模型版本。公司建议,用户在“隔离环境”中启用这一新功能,即在与生产系统分离的沙箱环境中进行使用,以在出现问题时降低潜在影响。


分享:


发表评论

登录后才可评论。 去登录