OpenAI 于 2026 年 3 月 5 日(当地时间)正式发布全新 AI 模型「GPT-5.4 Thinking」和「GPT-5.4 Pro」。
新模型将通过 ChatGPT 与 API 等渠道提供,重点强化在电子表格制作与分析、演示文稿(PPT)撰写、代码编写等专业实务场景中的表现,旨在更直接地支撑真实工作流程,而不仅仅是聊天或搜索替代。
OpenAI 表示,GPT-5.4 系列的目标,是「能够以更少的交互,更准确、高效地完成复杂的实际工作任务」。
根据 OpenAI 官方博客《Introducing GPT-5.4》的介绍,GPT-5.4 将陆续在 ChatGPT、API 以及 Codex 等产品中上线。在 ChatGPT 中,该模型以「GPT-5.4 Thinking」的名称提供;同时,面向更高难度任务的上位版本「GPT-5.4 Pro」也同步公开。
ChatGPT 中叫「Thinking」,API 中为「gpt-5.4」
在 ChatGPT 产品中,用户将以「GPT-5.4 Thinking」的形式使用这一新模型;在 API 中,对应的模型名称为「gpt-5.4」,而高阶版本则以「gpt-5.4-pro」提供。
GPT-5.4 Thinking 将取代此前的推理模型「GPT-5.2 Thinking」,成为新的默认推理模型。该模型主要面向 ChatGPT 的 Plus、Team、Pro 等付费方案用户开放。
面向「复杂实务任务」的生产力模型
OpenAI 将 GPT-5.4 定位为专门面向专业人士、知识工作者的生产力模型。官方特别强调了以下几类任务上的性能提升:
- 电子表格的创建与数据分析
- 演示文稿(PPT)结构设计与内容撰写
- 前端开发等方向的代码编写与修改
- 长篇文档的理解、总结与生成
- 借助外部工具进行调研、分析与决策支持
相较于以往更多用于对话、问答或搜索替代的生成式 AI,GPT-5.4 在设计上更强调「直接参与实际工作」,帮助用户完成可落地的业务产出。

下图为 GPT-5.4(左)与 GPT-5.2(右)在演示文稿生成上的对比示例。GPT-5.4 能够更好地整理多种内容,生成结构更清晰、可直接用于工作的幻灯片。
上位版「GPT-5.4 Pro」:面向长时、复杂任务
与 GPT-5.4 Thinking 同时发布的「GPT-5.4 Pro」,面向的是更复杂、耗时更长的任务场景。根据 API 文档说明,GPT-5.4 Pro 会调用更多计算资源进行推理,从而在复杂问题上给出更高精度的回答。
OpenAI 将 GPT-5.4 Pro 描述为「适用于更困难任务和长流程工作流的模型」。在某些复杂处理场景下,模型生成完整响应可能需要数分钟时间。
基准测试:知识工作任务显著提升
OpenAI 也公布了 GPT-5.4 的多项基准测试结果,用于评估其在知识工作场景中的表现。
在覆盖 44 种职业、用于评估知识劳动任务的内部基准「GDPval」中,GPT-5.4 的得分为 83.0%,明显高于上一代 GPT-5.2 的 70.9%。
在模拟投行分析师进行电子表格操作的测试中,GPT-5.4 的平均正确率达到 87.3%,相比 GPT-5.2 的 68.4% 有大幅提升。
在演示文稿质量评估中,由人工评审者对比选择生成结果时,有 68.0% 的情况下更偏好 GPT-5.4 生成的内容。
API 版本支持超 100 万 Token 上下文
在 API 侧,GPT-5.4 Pro 支持约 105 万 Token 的超大上下文窗口,最大输出长度为 128,000 Token,适合处理极长文档、复杂项目资料或多轮长对话等场景。模型的知识更新截止时间为 2025 年 8 月。
