OpenAI 发布「GPT-5.4 Thinking」「GPT-5.4 Pro」：大幅强化表格、文档与编码等专业实务能力

AI 2026-03-07 OpenAI, GPT-5.4, 大模型, 生产力工具, AI开发 48 次浏览

OpenAI 于 2026 年 3 月 5 日（当地时间）正式发布全新 AI 模型「GPT-5.4 Thinking」和「GPT-5.4 Pro」。

新模型将通过 ChatGPT 与 API 等渠道提供，重点强化在电子表格制作与分析、演示文稿（PPT）撰写、代码编写等专业实务场景中的表现，旨在更直接地支撑真实工作流程，而不仅仅是聊天或搜索替代。

OpenAI 表示，GPT-5.4 系列的目标，是「能够以更少的交互，更准确、高效地完成复杂的实际工作任务」。

根据 OpenAI 官方博客《Introducing GPT-5.4》的介绍，GPT-5.4 将陆续在 ChatGPT、API 以及 Codex 等产品中上线。在 ChatGPT 中，该模型以「GPT-5.4 Thinking」的名称提供；同时，面向更高难度任务的上位版本「GPT-5.4 Pro」也同步公开。

ChatGPT 中叫「Thinking」，API 中为「gpt-5.4」

在 ChatGPT 产品中，用户将以「GPT-5.4 Thinking」的形式使用这一新模型；在 API 中，对应的模型名称为「gpt-5.4」，而高阶版本则以「gpt-5.4-pro」提供。

GPT-5.4 Thinking 将取代此前的推理模型「GPT-5.2 Thinking」，成为新的默认推理模型。该模型主要面向 ChatGPT 的 Plus、Team、Pro 等付费方案用户开放。

面向「复杂实务任务」的生产力模型

OpenAI 将 GPT-5.4 定位为专门面向专业人士、知识工作者的生产力模型。官方特别强调了以下几类任务上的性能提升：

电子表格的创建与数据分析
演示文稿（PPT）结构设计与内容撰写
前端开发等方向的代码编写与修改
长篇文档的理解、总结与生成
借助外部工具进行调研、分析与决策支持

相较于以往更多用于对话、问答或搜索替代的生成式 AI，GPT-5.4 在设计上更强调「直接参与实际工作」，帮助用户完成可落地的业务产出。

下图为 GPT-5.4（左）与 GPT-5.2（右）在演示文稿生成上的对比示例。GPT-5.4 能够更好地整理多种内容，生成结构更清晰、可直接用于工作的幻灯片。

上位版「GPT-5.4 Pro」：面向长时、复杂任务

与 GPT-5.4 Thinking 同时发布的「GPT-5.4 Pro」，面向的是更复杂、耗时更长的任务场景。根据 API 文档说明，GPT-5.4 Pro 会调用更多计算资源进行推理，从而在复杂问题上给出更高精度的回答。

OpenAI 将 GPT-5.4 Pro 描述为「适用于更困难任务和长流程工作流的模型」。在某些复杂处理场景下，模型生成完整响应可能需要数分钟时间。

基准测试：知识工作任务显著提升

OpenAI 也公布了 GPT-5.4 的多项基准测试结果，用于评估其在知识工作场景中的表现。

在覆盖 44 种职业、用于评估知识劳动任务的内部基准「GDPval」中，GPT-5.4 的得分为 83.0%，明显高于上一代 GPT-5.2 的 70.9%。

在模拟投行分析师进行电子表格操作的测试中，GPT-5.4 的平均正确率达到 87.3%，相比 GPT-5.2 的 68.4% 有大幅提升。

在演示文稿质量评估中，由人工评审者对比选择生成结果时，有 68.0% 的情况下更偏好 GPT-5.4 生成的内容。

API 版本支持超 100 万 Token 上下文

在 API 侧，GPT-5.4 Pro 支持约 105 万 Token 的超大上下文窗口，最大输出长度为 128,000 Token，适合处理极长文档、复杂项目资料或多轮长对话等场景。模型的知识更新截止时间为 2025 年 8 月。

发表评论

登录后才可评论。去登录