Anthropic 于 2026 年 5 月 28 日正式开始一般提供最新 AI 模型「Claude Opus 4.8」。作为对 Opus 4.7 的升级版本,新模型在编码、智能代理任务以及各类专业场景中的表现得到强化,尤其是在长时间连续工作时的一致性方面有明显提升。
在价格方面,Claude Opus 4.8 与 Opus 4.7 保持一致。目前已面向 Claude Pro、Max、Team、Enterprise 等订阅用户开放,开发者则可以通过 Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry 等平台进行调用。
在编码、推理与电脑操作方面全面升级
在 Anthropic 的 Claude 模型家族中,Claude Opus 4.8 被定位为适合复杂推理、代理型编码和高自主度任务的高端型号。根据 Claude API 文档的说明,Opus 4.8 是当前最适合处理复杂推理、长周期代理型编码以及高度自律任务的顶级模型。
Anthropic 公布的对比数据显示,相比 Opus 4.7,Opus 4.8 在代理型编码、复杂推理、电脑操作、金融分析等多项评估中都有所提升。在 SWE-Bench Pro、Humanity’s Last Exam、OSWorld-Verified、GDPval-AA、Finance Agent v2 等更贴近真实业务和代理任务的基准测试中,Opus 4.8 的得分均有进步。
不过,在部分涉及终端操作的编码评测项目上,Anthropic 也指出仍有其他厂商模型表现更优。
Claude Opus 4.8 与主要模型的基准测试对比

“诚实性”提升:更少无依据的自信结论
除了性能提升外,Anthropic 特别强调了 Opus 4.8 在“honesty”(诚实性)方面的改进。传统大模型有时会在依据不足的情况下,仍然给出看似笃定的结论。Opus 4.8 被设计得更倾向于在任务中明确表达不确定性,减少在缺乏证据时做出武断判断。
据 Anthropic 介绍,Opus 4.8 在审视自己生成代码时忽略缺陷的概率,相比 Opus 4.7 降低到了约四分之一。在对齐性(alignment)评估中,模型在支持用户自主决策、并按照用户利益行事方面的倾向也有所增强。
在 Anthropic 公布的「Misaligned behavior」评估中,Opus 4.8 的得分低于 Opus 4.7,接近 Claude Mythos Preview 的水平。Claude Mythos Preview 是 Anthropic 在网络安全项目「Project Glasswing」中使用的未公开模型,并未面向一般用户提供。Opus 4.8 虽然并非 Mythos 本身,但在对齐性评估上已经接近该内部顶级模型的表现。
Anthropic 给出的对齐性评估结果:Opus 4.8 的 misaligned behavior 得分低于 Opus 4.7


Claude Code:更适合长时间开发任务
配合 Opus 4.8 的发布,Anthropic 也更新了 Claude Code 相关功能。Claude Code 新增了用于支持长时长开发工作的 dynamic workflows,用户可以通过 /goal 命令与代理共享任务目标和工作计划,让模型在较长的开发周期中保持方向一致。
在 Opus 4.8 中,effort 参数的默认值被提升为 high。对于复杂编码或高自主度任务,Anthropic 建议显式将 effort 设置为 xhigh,以获得更充分的推理与规划能力。
此外,Claude Code GitHub Actions 也已经支持使用 Opus 4.8。不过其默认模型仍为 Sonnet,如需使用 Opus 4.8,需要在配置中将模型参数显式指定为 claude-opus-4-8。
@YouTube
标准支持 100 万 Token 上下文窗口
面向开发者,Claude Opus 4.8 标配支持 100 万 token 的上下文窗口,并可输出最多 128,000 token。根据 Claude API 文档,Opus 4.8 的 API ID 为 claude-opus-4-8,定价为:输入每 100 万 token 收费 5 美元,输出每 100 万 token 收费 25 美元。
从 Opus 4.7 迁移到 Opus 4.8 不涉及破坏性变更。PDF 解析、图像输入、工具调用等功能与 Opus 4.7 保持一致。需要注意的是,在 Microsoft Foundry 上,发布初期的上下文窗口为 20 万 token,而 100 万 token 的上下文目前可通过 Claude API、Amazon Bedrock、Vertex AI 等平台使用。
Claude API 上旧版 Claude Opus 4 模型计划于 2026 年 6 月 15 日停止提供。Anthropic 推荐用户迁移至 Claude Opus 4.8 作为替代,对现有 Opus 4 用户来说,这是主要的升级路径之一。
总体来看,Claude Opus 4.8 不仅在单模型性能上有所增强,还与 Claude Code 以及 API 侧的长时长任务支持能力一同升级。Anthropic 明确将其定位于编码和专业工作场景下的智能代理使用,强调的不仅是模型的推理与执行能力,也包括任务过程的一致性以及对不确定性的更谨慎处理。
