奥特曼称新版ChatGPT写作能力出现回退:OpenAI在更新中“搞砸了”

richlovec 1500_400 (1)
 

OpenAI长期以来以“新版本ChatGPT较上一代更强”为外界印象,但公司最新一次更新引发用户集中反馈:聊天机器人在写作场景中变得更生硬、表达更公式化。OpenAI首席执行官山姆·奥特曼随后公开承认,新版本在写作能力上出现倒退,并表示公司在能力取舍上“搞砸了”。

奥特曼公开承认写作表现“倒退”

围绕此次争议的焦点是与GPT-5.2更新相关的最新ChatGPT模型。奥特曼在一次线上会议中表示,新模型在部分技术任务上表现更好,但在人类语言写作方面出现回退,并用“我们就是搞砸了”形容这次调整。

用户反馈与其表态相呼应。多名用户称,新版ChatGPT在撰写论文、营销文案或长篇内容时创造力下降、语气更趋模板化,文本结构也更显通用。相关分析同样将问题指向写作能力的回归,并引用奥特曼的说法作为佐证。

训练侧重转向推理与编码,被指影响文风

奥特曼解释称,GPT-5.2的训练重点更偏向推理深度、编码准确性以及工程化问题解决能力。他表示,由于“带宽有限”,团队在迭代中需要对功能优先级作出取舍,而此次强化数学与编码能力的同时,牺牲了叙事流畅性等写作表现。

外部评估也出现类似结论,认为该版本在数学与编码方面“过度训练”,对风格细节关注不足。OpenAI方面亦将写作体验下降归因于对技术领域能力的强调,这被视为公司少见地将用户体验变化与具体训练选择直接关联。

用户投诉与官方信息相互印证

在GPT-5.2更新后,OpenAI官方博客提到“更新后用户注意到写作质量下降”,奥特曼随后确认相关判断属实。他还将新模型与早期版本对比,称此前的GPT-4.5在部分文体表现上更强。

独立报道对回退的具体表现作出描述,包括草稿更通用、长篇结构较弱,以及在不同提示下语调更趋平淡。Shalabh Singh的一份分析指出,新模型在处理细腻草稿与长篇内容时表现较差,但在结构化任务上有所提升。

近期并非首次出现“搞砸了”的公开表态

奥特曼的表态也被外界与此前一次公开反思联系起来。报道提到,去年8月奥特曼曾就早期GPT-5发布表示OpenAI“完全搞砸了”,当时批评更多集中在发布过程、营销与预期管理等层面。

在此次GPT-5.2争议中,OpenAI对能力取舍的公开说明,使外界得以观察模型迭代中不同能力之间的权衡,以及更新失误对依赖写作功能用户带来的影响。


分享:


发表评论

登录后才可评论。 去登录