OpenAI攻克埃尔德什单位距离猜想:AI首次独立反驳80年数学难题

2025年5月20日,OpenAI宣布了一项震动数学界的成果:其内部通用推理模型在没有人类提示、没有数学专用微调、没有任何针对性引导的情况下,独立反驳了保罗·埃尔德什在1946年提出的平面单位距离猜想。这是公开记录中,AI首次自主解决一个处于数学子领域核心位置的开放难题。

平面单位距离问题:简单表述背后的极难挑战
想象在一张纸上画N个点,然后问:其中距离恰好为1的点对,最多能有多少对?
这个问题听起来简单,解决起来却极其困难。1946年,匈牙利数学家保罗·埃尔德什正式提出了这个问题,给出了最初的构造,并悬赏500美元求解。保罗·埃尔德什(Paul Erdős, 1913-1996)是20世纪最多产的数学家之一,一生发表了超过1500篇论文,与500多位合作者共同工作。他以提出问题和悬赏求解的方式推动数学发展而闻名,其悬赏金额从25美元到数千美元不等,反映了他对问题难度的判断。埃尔德什对组合数学、图论、数论等领域的贡献奠定了现代离散数学的基础,他的许多问题至今仍未解决,构成了这些领域的核心研究方向。
设U(N)为N个点中最大单位距离点对数,最简单的构造是把N个点排成一条直线、间距为1,得到N-1对;方格构造可以给出大约2N对。
埃尔德什通过缩放方格,得到了更好的结果:N的(1+C/lnN)次方。由于lnN趋向无穷非常慢,指数中的附加项几乎为零,增长只比线性快一点点。80年来,没有人能显著超过这个下界。
学界长期共识:缩放方格构造已是最优
学界由此形成了一个强烈的共识:缩放方格的构造本质上是最优的,不可能找到比它显著更好的构造。用数学语言说,埃尔德什猜想U(N)的上界是N^(1+o(1)),其中o(1)是随N趋向于0的项。
这个猜想得到了大量间接证据支持。1984年Spencer、Szemerédi和Trotter证明了上界结果U(N) ≤ O(N^(4/3)),即N个点中单位距离点对数不超过N的4/3次方的常数倍。这个上界的证明使用了Szemerédi-Trotter关于点线关联数的著名定理——该定理是计算几何和组合几何中最基本的工具之一,它精确刻画了平面上点和直线之间的最大关联数。这意味着真实答案被夹在N^(1+ε)(下界,来自埃尔德什的构造)和N^(4/3)(上界)之间。后来的研究还表明对于大多数非欧几里德距离,这个猜想是成立的。普林斯顿的Noga Alon称其为"埃尔德什最喜欢的问题之一",Brass、Moser和Pach在《离散几何中的研究问题》中说这可能是"组合几何中最著名、也最容易解释的问题"。
AI的突破路径:代数数论遇上初等几何
AI的证明没有给出显式的Delta值,但普林斯顿数学教授Will Sawin随后改进了结果,证明可以取Delta=0.014。别看0.014这个数字小,在渐近分析里这是质的不同——从"比线性快一点点"变成了多项式级别的改进。
要理解这个区别的深刻含义:在渐近分析中,o(1)表示一个随N增大而趋向于0的量,比如C/ln(N)。这意味着对于任何固定的ε>0,当N足够大时,指数中的附加项都小于ε。而δ=0.014是一个固定的正常数,不随N变化。在埃尔德什的旧构造中,增长率N^(1+C/lnN)虽然超过线性,但超出的幅度随N增大而不断缩小;而新构造给出的N^(1.014)则是一个真正的多项式改进,增长率与N的规模无关地保持在线性之上。这就是为什么0.014虽然看起来很小,却代表了从"亚多项式改进"到"多项式改进"的质的飞跃。
跨领域洞察:从高斯整数到无限类域塔
这是整个事件中最令人惊讶的部分:AI没有发明新的几何工具,而是做了一件让所有人都没想到的事——把代数数论的思想引入了这个初等几何问题。
埃尔德什原始构造的技巧可以通过高斯整数(a+bi形式的复数)来理解,这是最简单的一种代数数环。高斯整数是形如a+bi的复数,其中a和b都是普通整数,i是虚数单位(i²=-1)。高斯整数构成一个环(即可以进行加法和乘法运算的代数结构),记为Z[i]。在高斯整数中,"单位"是模为1的元素,只有±1和±i四个。代数数环是高斯整数的推广——它们是由代数数(某个整系数多项式的根)构成的环。不同的代数数环具有不同的算术性质和对称性,而这些性质可以被用来构造具有特定几何属性的点集。
AI的洞察在于:如果换一种更复杂、对称性更丰富的代数数环,就能获得更多的单位长度差,从而构造出更多的单位距离点对。
具体来说,AI用到了无限类域塔和Golod-Shafarevich理论这些代数数论中的经典工具,来证明所需的复杂数环确实存在。类域塔是代数数论中的核心概念:给定一个数域K,它的希尔伯特类域是K的一个特殊扩张,其伽罗瓦群同构于K的理想类群。反复取希尔伯特类域就得到类域塔。1964年,Golod和Shafarevich证明了一个划时代的定理:存在无限的类域塔,即这个迭代过程永远不会终止。这解决了类域塔问题,同时也证明了存在具有特殊算术性质的无限数域扩张链。AI正是利用这一理论来保证所需的"足够复杂且对称性足够丰富"的代数数环确实存在,从而使得构造中可以产生足够多的单位距离点对。
这些概念对数论学家来说是常识,但把它们和平面几何中的单位距离问题联系起来,是一个巨大的惊喜。
九位顶级数学家的严格验证
这个结果经过了九位顶级数学家的严格验证,他们不仅确认了证明的正确性,还联名写了一篇伴生论文。这个阵容极其豪华:包括菲尔兹奖得主Timothy Gowers、普林斯顿的Noga Alon和Will Sawin、剑桥的Thomas Bloom等。
Gowers在伴生论文中称这个结果为"AI数学的里程碑"。数论学家Arush Shankar的评价更直白:"在我看来,这篇论文证明了当前的AI模型不仅仅是人类数学家的助手,他们有能力产生原创性的巧妙想法,并将其贯彻到底。"
Thomas Bloom的深度反思
Bloom的伴生笔记特别值得细读。他首先指出,反驳一个猜想通常比正面证明一个定理要容易,因为反驳只需要找到一个反例。但即便如此,这个反例的构造质量远超预期。
Bloom写道,他评估AI证明时问自己的核心问题是:"这是否教给了我们关于单位距离问题的一些新东西?我们现在是否更好地理解了离散几何?"他的答案是谨慎地肯定:AI揭示了一个关键事实——数论构造对这类几何问题还有比我们之前所怀疑的更多的话要说,而且所需的数论可以非常深刻。
Bloom预言,未来几个月里许多代数数论学家会仔细审视离散几何中的其他开放问题。他还写了一段很有诗意的话:"AI正在帮助我们更充分地探索几个世纪以来我们建造的数学大教堂。还有哪些看不见的奇迹正在等待发现?"
这一突破的三重深远意义
AI自主解决前沿数学问题的首个确凿案例
之前的AI数学成就,比如AlphaGeometry解奥赛题、AI辅助证明,要么是在已知框架内解题,要么是人类主导、AI辅助。2024年初,DeepMind的AlphaGeometry系统在国际数学奥林匹克级别的几何题上达到了银牌水平,但该系统是专门为竞赛几何设计的,使用了符号推理引擎和神经网络的混合架构,且解决的是已知有解的竞赛题目。此外,Terence Tao等数学家曾使用AI辅助工具(如Lean证明助手中的AI建议功能)来加速形式化证明过程,但核心思路仍由人类提供。
这一次,AI是完全自主的——没有人告诉它用什么方法,没有人给它提示,它甚至不是一个专门为数学设计的系统,而是通用推理模型在一组测试题上"碰巧"产出了这个突破。这标志着AI从"工具"向"独立研究者"角色的质变。
跨领域洞察力:AI展现数学家最珍贵的能力
AI没有走几何学的老路,而是从代数数论里拿来了工具,打通了两个原本看似无关的领域。这种跨领域的洞察力,恰恰是人类数学家最珍贵的能力之一。数学史上许多重大突破都来自于这种意想不到的联系——比如安德鲁·怀尔斯证明费马大定理时将椭圆曲线与模形式联系起来,或者格罗滕迪克用代数几何的语言统一了数论和几何。AI展现出类似的"联想"能力,暗示着大语言模型在海量数学文献训练中可能形成了某种跨领域的隐式知识图谱。
人机协作新范式的诞生
AI产出原始证明,人类数学家验证、简化、深化、写伴生论文。这种"AI一次性产出+人类精化协作"的模式,可能是未来数学研究的常态。Will Sawin将AI的Delta从存在性结果改进为具体的0.014,正是这种协作的典范——AI提供了关键的概念突破,人类数学家则发挥了精确化和优化的专长。
需要清醒认识的局限性
当然也要说清楚局限:
- 反驳比证明容易:AI做的是给出反例(构造一个超越旧下界的点集配置),不是证明定理(比如确定U(N)的精确渐近阶)。在数学中,构造性反例通常只需要一个巧妙的想法,而正面证明往往需要发展全新的理论框架。
- 成功率极低:OpenAI的图表显示,在较低的测试时计算量下,模型对这道题的成功率接近零,只有在极长的推理链条下才偶尔成功。这意味着模型需要进行大量的"思考"——可能涉及数千个推理步骤——才能偶然触及正确的思路。
- 不可稳定复现:这不是一个可以按需产出的过程。我们无法简单地给模型另一个开放问题并期待类似的突破。
尽管如此,这一事件揭示了代数数论对几何问题的巨大潜力,可能开启一个代数数论学家涌入离散几何的新时代。AI的突破不仅解决了一个具体问题,更重要的是它指明了一个全新的研究方向——用深层代数结构来攻克组合几何中的经典难题。AI正在以我们未曾预料的方式,重新绘制数学研究的版图。
核心要点
相关推荐

阿里云网站架构全解析:从DNS到弹性伸缩的完整链路
系统梳理阿里云网站架构核心组件,按用户请求流向详解DNS云解析、CDN、WAF防火墙、CLB/ALB负载均衡、ECS云服务器、Redis缓存、NAS/OSS存储及弹性伸缩等服务的作用与协作关系,帮助初学者建立完整的云架构认知体系。

Claude Code实战:60美元4小时完成复杂支付系统二开
通过真实商业案例详解Claude Code + Opus 4.7如何在4小时内完成复杂支付系统二开,涵盖CC Switch配置、Prompt工程技巧、模型选择策略及AI Coding工程化落地方法论。

Vibe Coding入门指南:零基础用AI写代码的完整攻略
Vibe Coding(氛围编程)让零基础用户通过自然语言指令实现软件开发。本文详解Vibe Coding的核心概念、适用场景、推荐工具及实践步骤,帮你快速上手AI编程。