数学爱好者一条提示，撬动半世纪难题：GPT-5.4 Pro 证明埃尔德什问题 #1196，并已通过 Lean 形式验证

AI 2026-05-06 人工智能, 数学, 埃尔德什问题, 形式化验证, Lean 32 次浏览

一位数学爱好者给出的提示词，意外推动了一道可以追溯到半个多世纪前的数学难题被 ChatGPT 解出，并最终获得正式认可。

这道题出自著名的「Erdős Problems」列表中的「Erdős Problem #1196」。该列表系统整理了匈牙利数学家保罗·埃尔德什（Paul Erdős）提出的大量猜想与问题，其中许多至今仍是数学研究的前沿课题。

所谓“埃尔德什问题”，一般指围绕埃尔德什在数论、组合论、图论等领域提出的众多问题而形成的未解难题集合。埃尔德什在 20 世纪提出了极其丰富的猜想和问题，影响深远，直到今天仍有数学家持续尝试攻克。

在 Erdős Problems 官方页面上，问题 #1196 的状态目前已被标注为「PROVED（LEAN）」，并明确写明：该问题的证明已经通过定理证明辅助系统 Lean 的形式化验证。页面说明指出，这一问题与埃尔德什、András Sárközy 和 Endre Szemerédi 提出的一个猜想有关。GPT-5.4 Pro 在 Liam Price 给出的提示下，给出了对任意原始集合（primitive set）的一个上界证明。

一些海外媒体将 Price 称为“业余数学爱好者”。《Scientific American》在报道中提到，他今年 23 岁，并未接受过系统的高等数学训练。

GPT-5.4 Pro 证明了「Erdős Problem #1196」

Erdős Problem #1196 讨论的是整数集合的性质。

例如，在一个整数集合中，如果同时包含“2”和“4”，那么 4 可以被 2 整除。像这样，集合中存在“一方能整除另一方”的数对关系。

与之相对，如果从集合中任意取出两个不同的整数，都不存在“一个能整除另一个”的情况，那么这样的集合就被称为“原始集合（primitive set）”。Erdős Problem #1196 要研究的，就是对这类原始集合中某个特定求和表达式，其取值最多能大到什么程度。

据 Erdős Problems 官方页面介绍，此前数学家 Jared Duker Lichtman 已经给出了一个上界结果，而 GPT-5.4 Pro 在此基础上给出了更强的上界证明。页面上明确写道，这一成果是由「GPT-5.4 Pro（prompted by Price）」完成的。

目前，问题页面已显示为「PROVED（LEAN）」，表明该证明已经通过 Lean 的形式化验证。

Price：80 分钟“一次成型”

2026 年 4 月 14 日，Liam Price 在 X（原 Twitter）上发文称，GPT-5.4 Pro 已经解决了 Erdős Problem #1196。他在贴文中强调，这是一道长期被研究的难题，因此这一结果具有实质性意义。

在另一条贴文中，Price 进一步说明，GPT-5.4 Pro 大约用 80 分钟就“一次成型”（one-shot）地给出了完整证明，之后又花了约 30 分钟将其整理为 LaTeX 格式的数学论文。

这里的 “one-shot”，并不是指多轮试错、逐步修补，而是指在一次运行中就生成了结构完整、逻辑连贯的证明草稿。

leeham x.jpg

Price 起初在 X 上表示，证明的形式化工作仍在进行中。随后，Erdős Problems 官方页面就将该问题的状态更新为「PROVED（LEAN）」。结合 Price 的公开说明与官方页面的记录，可以看出：GPT-5.4 Pro 生成的证明，经过数学界的讨论与审查，并最终通过 Lean 的形式验证，被正式记为一道未解问题的解决方案。

数学家在论坛中讨论证明细节

在 Erdős Problems 的论坛中，问题 #1196 同样被标记为「PROVED（LEAN）」。论坛里，数学家们围绕证明的思路、不同的表述方式等展开了持续讨论。

此次事件的关键在于，它并非停留在“社交媒体上有人声称 AI 解出了某题”的阶段，而是进入了更为正式的学术流程：结果被写入 Erdős Problems 官方页面，并在论坛中由数学家群体进行核查、重述和消化。

论坛讨论的重点包括：如何从概念上理解这份证明、怎样用现有的数学语言更清晰地表述、是否可以推广到相关的其他问题等。菲尔兹奖得主 Terence Tao 也在论坛中发言，就相关的随机过程和不变测度构造给出了评论。

也就是说，AI 给出的证明并不是“直接被当作正确答案照单全收”，而是先由人类数学家进行内容审阅，再进一步进入形式化验证环节。这一链条，是本次事件中非常重要的一点。

Lean 形式验证成为关键一环

这次案例中，证明通过 Lean 的形式验证同样备受关注。

Lean 是一种定理证明辅助系统，可以将数学证明用计算机可读的形式精确写出，并由程序逐步检查其逻辑是否严密、是否存在漏洞。传统的数学论文主要依靠人类审稿人阅读和推敲来判断正确性，而在 Lean 中，证明需要被拆解为更细致的逻辑步骤，由计算机进行严格检验。

在 Erdős Problems 官方页面上，关于问题 #1196 的条目明确写道：证明已经在 Lean 中通过验证。GitHub 上也公开了与该问题相关的 Lean 形式化代码。

由于生成式 AI 有时会给出“看似合理但实际上错误”的论证，因此，本次这样的流程——由 AI 提出证明草案，人类数学家进行审查，再交由 Lean 做机械化验证——被视为在数学研究中安全、可靠地使用 AI 的一个重要范式。

发表评论

登录后才可评论。去登录