AI「生肉证明」堆爆GitHub!陶哲轩重磅发声:只会解题没用了

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AI「生肉证明」堆爆GitHub!陶哲轩重磅发声:只会解题没用了
8070点击    2026-04-30 13:53

最近,陶哲轩在 Mastodon 抛出一记重磅判断——


数学正在从证明稀缺时代,进入证明过剩时代(from an era of proof scarcity to an era of proof abundance)!


AI「生肉证明」堆爆GitHub!陶哲轩重磅发声:只会解题没用了


在AI对Erdős问题的贡献Github页面上,20多份 AI 提交的全部或部分解,正堆在「pending assessment」(待评估)那一栏。


而在此之前,这个分类常年只有1-2份。


AI「生肉证明」堆爆GitHub!陶哲轩重磅发声:只会解题没用了

一夜之间,AI 正在以令人窒息的速度疯狂输出数学证明。


问题是——没人来得及看。


问题求解「三件套」


生成、验证、消化


陶哲轩把这次的思考建立在一个简洁的框架上。


他说,数学问题求解从来不是一件事,而是三件事:


  • Proof generation(证明生成):把一个猜想从「未解决」推到「有解」。
  • Proof verification(证明验证):确认这个解是对的,逻辑没有漏洞。
  • Proof digestion(证明消化):把证明读懂、讲透、提炼出方法论,让整个领域受益。


AI「生肉证明」堆爆GitHub!陶哲轩重磅发声:只会解题没用了


在过去的几百年里,三件事基本由同一拨人完成——你证了一个定理,你自然理解它,你写论文解释它。


这三个环节之间不存在「瓶颈差」。


但 AI 来了之后,情况变了。


生成环节被 LLM 大幅加速,验证环节有 Lean、Coq 等形式化工具兜底,唯独消化环节——那个需要人类大脑去理解「这个证明到底意味着什么」的环节——完全跟不上。


陶哲轩用了一个精确的工程术语来形容这种错位:impedance mismatch(阻抗失配)


三个环节的速度不匹配了:证明像洪水一样涌来,但理解的堤坝还是手工砌的。


他说,想象两种社会。


食物稀缺的社会,最受尊敬的人是猎手和农夫——是那些「bring home the bacon」(把食物带回家)的人。


你猎回一头鹿,不管肉质如何,整个部落都会感激你,会有人主动帮你清洗、烹饪、分配。几乎任何没有毒的食物贡献都受欢迎。


食物过剩的社会则完全不同。


想象一个 pot-luck 派对(每人带一道菜的聚餐)。如果一个陌生人闯进来,扔下一块来路不明的生肉,让大家自己去处理——没有人会高兴。


甚至超市买来的预包装食品,也只是勉强算数。


真正受欢迎的,是社区里受信任的成员精心烹制的家常菜——不仅因为好吃,更因为围绕这道菜的对话本身就是社交的一部分,也是培养下一代厨师的机会。


回到数学——AI 跑出来的「生肉证明」(raw proof),就是那块被陌生人扔在派对上的神秘肉。


它可能是正确的。它可能通过了形式化验证。


但没有人清洗过它、烹饪过它、也没有人能告诉你它到底好不好吃。


AI「生肉证明」堆爆GitHub!陶哲轩重磅发声:只会解题没用了


陶哲轩直言:这种「贡献」不仅没有推进问题的实际进展(do not measurably advance the progress),反而可能产生一个「负面效果」——它杀死了人们继续研究这个问题的兴趣


问题被宣告「已解决」了,但没人懂这个解。


好比一道菜被端上桌,但没人敢动筷子。


于是这道菜——连同围绕它可能产生的所有对话和灵感——就这样凉了。


Erdős #1196,唯一跑通「三件套」的案例


理论都需要一个切片去检验。


陶哲轩反复提到的那个切片,就是 Erdős 问题 #1196。


这是一个关于「primitive sets」(本原集)的猜想:在一个整数集合中,如果没有任何元素整除另一个元素,那么对所有元素 a 按 1/(a·log a) 求和,当集合元素趋于无穷大时,这个和是否趋近于1?


1968年,Erdős、Sárközy 和 Szemerédi 提出了这个猜想。


AI「生肉证明」堆爆GitHub!陶哲轩重磅发声:只会解题没用了


此后将近60年,数学家们不断逼近——斯坦福数学家 Jared Lichtman 花了数年证明了一个相关的上界(约1.399),但最终的渐近猜想始终悬而未决。


2026年4月的某个周一下午,23岁的 Liam Price 把这道题丢进了 GPT-5.4 Pro。


Price 没有数学博士学位,没有多年的专业训练。他用的是一个20美元/月的 ChatGPT Pro 订阅——任何人都能用的工具。


AI「生肉证明」堆爆GitHub!陶哲轩重磅发声:只会解题没用了


80分钟。


模型走通了一条数学界忽视了近90年的路径:用 von Mangoldt 函数(一种经典的解析数论权重函数)结合马尔可夫过程理论,构造出了一个全新的证明框架。


这个技术组合已经存在了几十年,但从未有人想到把它用在本原集问题上。


证明出来了。


但如果故事到这里就结束,它只不过又是一块「神秘肉」。


关键在于接下来发生的事:陶哲轩亲自下场。


他在24小时内验证了证明的核心思路,随后将其扩展、重组、打磨,最终揭示出这个证明背后隐藏着一条更深层的联系——整数解剖学(integer anatomy)与马尔可夫过程理论之间一条此前未被描述的全新桥梁


这就是证明消化(proof digestion)。


不只是「对不对」的问题,而是「它意味着什么」的问题。


陶哲轩称 #1196 是目前唯一一个三阶段——生成、验证、消化——都基本跑通的案例。


也正因如此,他反复强调一个原则:理想状态是同一拨人完成全部三件事


而现实中,越来越多的人在用 AI 生成证明后,没时间去验证和消化,就直接提交了。


这正是 Erdős 问题近20多份待评估方案堆积的直接原因。


三处表态,同一判断


陶哲轩不是在一个地方随口说说。


他在几乎同一时期,通过三个不同渠道发出了同一个信号。


4月27日,Mastodon 长帖正式提出「证明稀缺→证明过剩」的范式判断。


4月27日,Nature 访谈(The job description is changing):他对记者 Davide Castelvecchi 说,数学家的「岗位描述」正在改变。一个拒绝碰 AI 工具、只想用传统方式做证明的研究生,未来可能会发现自己的机会越来越少。


能在传统数学功底之上熟练运用新工具的人,才会真正繁荣。


AI「生肉证明」堆爆GitHub!陶哲轩重磅发声:只会解题没用了


3月29日,博客长文《Mathematical methods and human thought in the age of AI》:他和 Klowden 花了超过一年写成这篇论文,试图超越眼前的技术细节,直面更根本的哲学问题——数学证明的本质是什么?论文的目的是什么?我们这个职业存在的意义是什么?


他在博客中写道:如果我们自己不回答这些问题,它们就会被科技公司或经济激励机制替我们回答。


AI「生肉证明」堆爆GitHub!陶哲轩重磅发声:只会解题没用了


三处表态,同一个内核:数学家的核心竞争力正在迁移——从「谁先生成证明」,转向「谁能选对问题、设计工作流、验证并消化结果」。


稀缺的不再是答案,而是理解。


更大的震荡:学术评价体系要重写


如果只是数学家的工作方式变了,那还只是一个学科内部的事。


但陶哲轩看到的远不止此。


当证明的成本被 AI 压到接近于零,当证明验证被 Lean/Coq 等形式化引擎大幅自动化——证明消化这个环节的价值就会被重估。


过去,消化证明是「免费的」。


你证了一个定理,你自然会理解它,会在论文里解释它。这个劳动从未被单独计价。


但当证明的生产者(AI)和理解者(人类)被拆开之后,消化就从隐性劳动变成了显性稀缺资源


这意味着整个学术声望的分配逻辑要变。


Citation 体系、论文评审标准、奖项评选规则、甚至招聘和晋升的依据——所有这些围绕「谁先证了什么」建立起来的激励结构,都将面临重构。


陶哲轩预测:就像现代社会不再把生食原料当作一顿饭一样,数学研究文化将不再把「未消化的裸证明」(raw, undigested proofs)视为对一个问题的解决方案。


未来的评判标准,将聚焦于一个贡献究竟在多大程度上丰富了整个领域,而非仅仅「解决」了问题本身。


而且这不只是数学一个学科的事。


AI for Math 的范式漂移,将成为所有强证明型学科的预演——理论物理中的计算验证、密码学中的安全性证明、软件工程中的形式化验证——所有依赖「正确性论证」作为核心产出的领域,都将面临同样的「阻抗失配」。


证明会越来越多,越来越快,越来越便宜。


证明的时代没有结束。


但「证明即一切」的时代,正在落幕。


未来属于那些不仅能「算出来」,更能「讲明白」的人。


参考资料:


https://mathstodon.xyz/@tao/116477351524980995


https://mathstodon.xyz/@tao/116450581967483825


https://www.nature.com/articles/d41586-026-01246-9


https://terrytao.wordpress.com/2026/03/29/mathematical-methods-and-human-thought-in-the-age-of-ai/


文章来自于微信公众号 "新智元",作者 "新智元"

关键词: AI新闻 , AI数学 , AI科研 , 陶哲轩
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费