Anthropic正式发布 Claude Opus 4.8：强化编码与智能代理能力，价格与 4.7 持平

AI 2026-05-30 Anthropic, Claude Opus 4.8, 大模型, AI 编码, 智能代理 17 次浏览

Anthropic 于 2026 年 5 月 28 日正式开始一般提供最新 AI 模型「Claude Opus 4.8」。作为对 Opus 4.7 的升级版本，新模型在编码、智能代理任务以及各类专业场景中的表现得到强化，尤其是在长时间连续工作时的一致性方面有明显提升。

在价格方面，Claude Opus 4.8 与 Opus 4.7 保持一致。目前已面向 Claude Pro、Max、Team、Enterprise 等订阅用户开放，开发者则可以通过 Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry 等平台进行调用。

在编码、推理与电脑操作方面全面升级

在 Anthropic 的 Claude 模型家族中，Claude Opus 4.8 被定位为适合复杂推理、代理型编码和高自主度任务的高端型号。根据 Claude API 文档的说明，Opus 4.8 是当前最适合处理复杂推理、长周期代理型编码以及高度自律任务的顶级模型。

Anthropic 公布的对比数据显示，相比 Opus 4.7，Opus 4.8 在代理型编码、复杂推理、电脑操作、金融分析等多项评估中都有所提升。在 SWE-Bench Pro、Humanity’s Last Exam、OSWorld-Verified、GDPval-AA、Finance Agent v2 等更贴近真实业务和代理任务的基准测试中，Opus 4.8 的得分均有进步。

不过，在部分涉及终端操作的编码评测项目上，Anthropic 也指出仍有其他厂商模型表现更优。

Claude Opus 4.8 与主要模型的基准测试对比

“诚实性”提升：更少无依据的自信结论

除了性能提升外，Anthropic 特别强调了 Opus 4.8 在“honesty”（诚实性）方面的改进。传统大模型有时会在依据不足的情况下，仍然给出看似笃定的结论。Opus 4.8 被设计得更倾向于在任务中明确表达不确定性，减少在缺乏证据时做出武断判断。

据 Anthropic 介绍，Opus 4.8 在审视自己生成代码时忽略缺陷的概率，相比 Opus 4.7 降低到了约四分之一。在对齐性（alignment）评估中，模型在支持用户自主决策、并按照用户利益行事方面的倾向也有所增强。

在 Anthropic 公布的「Misaligned behavior」评估中，Opus 4.8 的得分低于 Opus 4.7，接近 Claude Mythos Preview 的水平。Claude Mythos Preview 是 Anthropic 在网络安全项目「Project Glasswing」中使用的未公开模型，并未面向一般用户提供。Opus 4.8 虽然并非 Mythos 本身，但在对齐性评估上已经接近该内部顶级模型的表现。

Anthropic 给出的对齐性评估结果：Opus 4.8 的 misaligned behavior 得分低于 Opus 4.7

Claude Code：更适合长时间开发任务

配合 Opus 4.8 的发布，Anthropic 也更新了 Claude Code 相关功能。Claude Code 新增了用于支持长时长开发工作的 dynamic workflows，用户可以通过 /goal 命令与代理共享任务目标和工作计划，让模型在较长的开发周期中保持方向一致。

在 Opus 4.8 中，effort 参数的默认值被提升为 high。对于复杂编码或高自主度任务，Anthropic 建议显式将 effort 设置为 xhigh，以获得更充分的推理与规划能力。

此外，Claude Code GitHub Actions 也已经支持使用 Opus 4.8。不过其默认模型仍为 Sonnet，如需使用 Opus 4.8，需要在配置中将模型参数显式指定为 claude-opus-4-8。

@YouTube

标准支持 100 万 Token 上下文窗口

面向开发者，Claude Opus 4.8 标配支持 100 万 token 的上下文窗口，并可输出最多 128,000 token。根据 Claude API 文档，Opus 4.8 的 API ID 为 claude-opus-4-8，定价为：输入每 100 万 token 收费 5 美元，输出每 100 万 token 收费 25 美元。

从 Opus 4.7 迁移到 Opus 4.8 不涉及破坏性变更。PDF 解析、图像输入、工具调用等功能与 Opus 4.7 保持一致。需要注意的是，在 Microsoft Foundry 上，发布初期的上下文窗口为 20 万 token，而 100 万 token 的上下文目前可通过 Claude API、Amazon Bedrock、Vertex AI 等平台使用。

Claude API 上旧版 Claude Opus 4 模型计划于 2026 年 6 月 15 日停止提供。Anthropic 推荐用户迁移至 Claude Opus 4.8 作为替代，对现有 Opus 4 用户来说，这是主要的升级路径之一。

总体来看，Claude Opus 4.8 不仅在单模型性能上有所增强，还与 Claude Code 以及 API 侧的长时长任务支持能力一同升级。Anthropic 明确将其定位于编码和专业工作场景下的智能代理使用，强调的不仅是模型的推理与执行能力，也包括任务过程的一致性以及对不确定性的更谨慎处理。

发表评论

登录后才可评论。去登录