Anthropic推出Claude Code自动模式在安全约束下提升自主执行能力

商业 2026-04-19 科技最前沿 Anthropic, Claude Code, 自动模式, AI安全, 开发工具 44 次浏览

对于使用AI开发工具的开发者而言，在代码生成和执行过程中，通常需要在逐项人工审批与放任模型自主运行之间作出取舍。Anthropic近日表示，其针对Claude Code的最新更新试图改变这一状况，让模型在一定范围内自行判断哪些操作可以安全执行，同时保持必要的限制。

据介绍，此次新增的“自动模式”（Auto Mode）目前处于研究预览阶段，可供测试但尚未作为正式产品发布。该模式体现了业内一项更广泛趋势：AI工具正被设计为在更少人工干预的前提下执行任务，以提高开发效率。然而，在速度与控制之间取得平衡仍被视为关键难点——限制过多可能影响效率，而限制过少则可能增加系统风险和不可预测性。

Anthropic称，自动模式在每次操作执行前会调用内置的AI安全机制，对即将执行的行为进行审查。系统会检查是否存在用户未请求的高风险行为，以及是否出现提示注入迹象。提示注入是一类攻击方式，通过在AI处理的内容中嵌入恶意指令，引导其执行非预期操作。根据审查结果，被判定为安全的操作将自动执行，而被视为存在风险的操作则会被阻止。

公司表示，这一功能可被视为Claude Code中现有“dangerously-skip-permissions”命令的延伸。后者将决策权几乎完全交由模型，但自动模式在此基础上叠加了安全审查层，试图在自主性与安全性之间增加一道防线。

自动模式建立在近期一系列自主编码工具的基础之上。此前，GitHub、OpenAI等公司已推出可代表开发者执行部分任务的工具。与这些产品相比，Anthropic此次更新进一步将“何时需要请求用户许可”的判断权部分交由模型自身完成。

目前，Anthropic尚未公开说明其安全层用于区分安全操作与风险操作的具体标准。业内观察人士认为，开发者在大规模采用该功能前，可能会关注相关细节。报道提到，TechCrunch已就此向Anthropic寻求更多信息。

在自动模式之前，Anthropic已推出Claude Code Review工具，用于在代码进入代码库前自动审查并发现潜在漏洞；以及Dispatch for Cowork功能，允许用户将任务分派给AI代理代为处理。

Anthropic表示，自动模式将在未来几天内向企业用户和API用户陆续开放。目前，该功能仅支持Claude Sonnet 4.6和Opus 4.6两个模型版本。公司建议，用户在“隔离环境”中启用这一新功能，即在与生产系统分离的沙箱环境中进行使用，以在出现问题时降低潜在影响。

发表评论

登录后才可评论。去登录