AI攻克数学猜想:GPT-5.2等大模型正系统性解决埃尔德什难题,数学研究范式面临重塑

数学界最负盛名的“悬赏榜单”正在被人工智能悄然改写。最新行业动态指出,在过去一段时间内,一系列长期悬而未决的埃尔德什问题(Erdős problems)被标记为“已解决”,而其中超过七成的解决方案背后,都有大型语言模型(LLM)的深度参与。这标志着AI不再仅仅是辅助工具,而是开始在高阶数学推理领域取得实质性、自主性的突破,其能力边界正以前所未有的速度拓展。

从辅助到突破:AI在数学猜想上的“解题狂欢”

市场消息显示,自去年年底以来,在由匈牙利传奇数学家保罗·埃尔德什提出的上千个公开猜想中,已有15个问题从“开放”状态转为“已解”。尤为引人注目的是,其中11个问题的解决过程明确记录了AI模型的贡献。这一现象并非偶然,而是与新一代大语言模型,尤其是被描述为“在数学推理上技能显著超越前代”的GPT-5.2的发布密切相关。

此前,AI解决数学问题多依赖于人类提供的关键指引或框架。然而,最近的案例显示,情况正在发生变化。有测试者将一道复杂的数论问题输入模型,在给予充分的“思考”时间后,模型不仅输出了一个完整的证明,其推理链条还娴熟地运用了勒让德公式(Legendre’s formula)、伯特兰假设(Bertrand’s postulate)等多个高等数学公理。更令人惊讶的是,其最终给出的证明与数学社区中已知的经典解法存在重要差异,在某些方面提供了更完备的解决方案。这表明AI已具备一定程度的创新性数学构造能力

技术基石:形式化验证与“长尾问题”的攻克

AI在数学领域的能力跃升,得益于两大技术趋势的融合。首先是形式化验证(Formal Verification)的普及。形式化验证指的是使用严格的逻辑语言和计算机可检查的代码来表述和验证数学证明,彻底杜绝了自然语言描述可能存在的模糊性。开源证明辅助工具Lean的广泛应用,为数学证明提供了坚实的“数字底座”。

其次,专注于形式化的AI工具,如Harmonic的Aristotle,正在将这一繁琐的过程自动化。它们能够理解自然语言描述的数学思路,并将其转化为机器可验证的形式化代码。这极大地降低了验证复杂证明的门槛和耗时。正如行业专家所言,AI的可扩展性使其特别适合被系统性地应用于埃尔德什问题中那些“长尾”的、冷门但解法可能相对直接的问题。许多这类问题现在更可能由纯AI方法率先解决,而非传统的人力或人机混合方式。

范式转变:顶尖数学家的接纳与AI的新角色

比解决几个具体问题更深远的,是顶尖数学研究群体对AI工具态度的转变。当世界级的数学和计算机科学教授开始公开表示他们在使用ChatGPT或Aristotle进行研究时,这本身就是一个强烈的信号。这些学者拥有需要维护的学术声誉,他们的采纳意味着这些工具提供的帮助是真实且有效的

著名数学家陶哲轩(Terence Tao)在其GitHub上详细追踪了AI在埃尔德什问题上的进展。他区分了AI模型取得实质性自主进展的案例,以及AI通过定位并基于前人研究取得进展的案例。尽管距离AI完全无需人类干预进行数学研究仍有漫漫长路,但大模型无疑正在扮演一个不可或缺的角色——它们可以是不知疲倦的研究助理、灵感触发器,或是复杂证明的验证者。

行业影响与未来展望:AI将如何重塑基础科学?

AI系统在高等数学问题上的突破,其意义远超技术演示。它预示着基础科学研究范式可能迎来一场深刻变革。

  • 研究效率革命:AI能够快速遍历海量的文献和可能的证明路径,将数学家从部分重复性、搜索性的劳动中解放出来,更专注于提出关键猜想和核心思想。
  • 知识民主化:强大的AI研究助手可能降低进行前沿数学探索的门槛,让更多机构和个体研究者有能力触及复杂问题。
  • 新发现引擎:AI通过其独特的“直觉”和模式识别能力,有可能发现人类思维惯性下忽略的关联,从而催生全新的数学分支或猜想。

当然,挑战也随之而来。如何确保AI生成证明的绝对正确性?如何界定AI在研究成果中的贡献?这都对现有的学术规范和评价体系提出了新课题。无论如何,当AI开始持续破解曾难倒人类智者数十年的数学谜题时,一个科学与人工智能协同进化、相互启迪的新时代已经拉开了序幕。

© 版权声明
通义千问广告 - 响应式版
通义千问大模型 免费资源包
7000万tokens 免费领!
额外赠送25%折扣卷
去官网领取优惠

相关文章

暂无评论

none
暂无评论...