奥特曼称新版ChatGPT写作能力出现回退：OpenAI在更新中“搞砸了”

AI 2026-02-01 向量笔记 OpenAI, ChatGPT, 山姆·奥特曼, 人工智能, 产品更新 60 次浏览

OpenAI长期以来以“新版本ChatGPT较上一代更强”为外界印象，但公司最新一次更新引发用户集中反馈：聊天机器人在写作场景中变得更生硬、表达更公式化。OpenAI首席执行官山姆·奥特曼随后公开承认，新版本在写作能力上出现倒退，并表示公司在能力取舍上“搞砸了”。

奥特曼公开承认写作表现“倒退”

围绕此次争议的焦点是与GPT-5.2更新相关的最新ChatGPT模型。奥特曼在一次线上会议中表示，新模型在部分技术任务上表现更好，但在人类语言写作方面出现回退，并用“我们就是搞砸了”形容这次调整。

用户反馈与其表态相呼应。多名用户称，新版ChatGPT在撰写论文、营销文案或长篇内容时创造力下降、语气更趋模板化，文本结构也更显通用。相关分析同样将问题指向写作能力的回归，并引用奥特曼的说法作为佐证。

奥特曼解释称，GPT-5.2的训练重点更偏向推理深度、编码准确性以及工程化问题解决能力。他表示，由于“带宽有限”，团队在迭代中需要对功能优先级作出取舍，而此次强化数学与编码能力的同时，牺牲了叙事流畅性等写作表现。

外部评估也出现类似结论，认为该版本在数学与编码方面“过度训练”，对风格细节关注不足。OpenAI方面亦将写作体验下降归因于对技术领域能力的强调，这被视为公司少见地将用户体验变化与具体训练选择直接关联。

在GPT-5.2更新后，OpenAI官方博客提到“更新后用户注意到写作质量下降”，奥特曼随后确认相关判断属实。他还将新模型与早期版本对比，称此前的GPT-4.5在部分文体表现上更强。

独立报道对回退的具体表现作出描述，包括草稿更通用、长篇结构较弱，以及在不同提示下语调更趋平淡。Shalabh Singh的一份分析指出，新模型在处理细腻草稿与长篇内容时表现较差，但在结构化任务上有所提升。

奥特曼的表态也被外界与此前一次公开反思联系起来。报道提到，去年8月奥特曼曾就早期GPT-5发布表示OpenAI“完全搞砸了”，当时批评更多集中在发布过程、营销与预期管理等层面。

在此次GPT-5.2争议中，OpenAI对能力取舍的公开说明，使外界得以观察模型迭代中不同能力之间的权衡，以及更新失误对依赖写作功能用户带来的影响。

登录后才可评论。去登录