AI资讯新闻榜单内容搜索-Lean

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Lean
32B超越671B!M-A-P全开源数学定理证明模型OProver,五项评测三项第一

32B超越671B!M-A-P全开源数学定理证明模型OProver,五项评测三项第一

32B超越671B!M-A-P全开源数学定理证明模型OProver,五项评测三项第一

形式化定理证明,一直是LLM公认最严苛的推理试金石,每一步推导都必须通过Lean 4内核的机器验证。

来自主题: AI技术研报
7463 点击    2026-06-09 09:37
消耗1830亿token,Meta用AI把数学教材翻译成了一个超大Lean库

消耗1830亿token,Meta用AI把数学教材翻译成了一个超大Lean库

消耗1830亿token,Meta用AI把数学教材翻译成了一个超大Lean库

编辑|Panda 数学正在迎来 AI 革命。 最近几个月尤为明显。比如,就在前几天,Google DeepMind 新论文宣布其最新系统 AlphaProof Nexus 在一次自主运行中,解决了 3

来自主题: AI资讯
8872 点击    2026-05-29 15:11
龙虾之父教你省钱:开源Skill给你的Skill减肥

龙虾之父教你省钱:开源Skill给你的Skill减肥

龙虾之父教你省钱:开源Skill给你的Skill减肥

Skill水平参差不齐,龙虾之父Peter看不下去了。

来自主题: AI技术研报
6504 点击    2026-05-26 16:05
陶哲轩亲测Claude跑崩电脑,全靠这份保姆级指令清单翻盘

陶哲轩亲测Claude跑崩电脑,全靠这份保姆级指令清单翻盘

陶哲轩亲测Claude跑崩电脑,全靠这份保姆级指令清单翻盘

从电脑崩溃到半小时拿下Lean形式化证明,数学大神陶哲轩用亲身踩坑经历警告:AI越强大,人类越不能偷懒,应时刻保持「人类在环」的绝对清醒。

来自主题: AI资讯
7478 点击    2026-03-11 16:57
656行代码5小时搞定,Axiom AI自主完成两项Erdős猜想形式化证明

656行代码5小时搞定,Axiom AI自主完成两项Erdős猜想形式化证明

656行代码5小时搞定,Axiom AI自主完成两项Erdős猜想形式化证明

近日,AI 初创公司 Axiom 宣布其模型在没有人类干预的情况下,自动完成了两个数学猜想的证明——埃尔德什问题(Erdős Problem)中的 481 号和 124 号。据称,481 号问题仅用时 5 小时,代码量为 656 行;124 号问题则耗时超 24 小时。值得关注的是,这些证明均通过 Lean 验证,Lean 的特点是其形式化证明过程无需人工干预,为数学正确性提供了保障。

来自主题: AI资讯
9181 点击    2025-12-05 14:49
30年数学难题,AI数学家Aristotle仅6小时告破!陶哲轩:ChatGPT们都失败了

30年数学难题,AI数学家Aristotle仅6小时告破!陶哲轩:ChatGPT们都失败了

30年数学难题,AI数学家Aristotle仅6小时告破!陶哲轩:ChatGPT们都失败了

昨晚,数学界炸了!由HarmonicMath开发的AI数学家「亚里士多德」(Aristotle),100%独立完成了埃尔德什问题#124。它在Lean证明系统中,耗时仅6个小时,验证只需1分钟。

来自主题: AI资讯
10179 点击    2025-12-01 12:41
陶哲轩,用AI爆改科研范式

陶哲轩,用AI爆改科研范式

陶哲轩,用AI爆改科研范式

陶哲轩让ChatGPT把复杂的数学论文翻译成Lean代码,与AI合作完成形式化证明。AI能理解论文、写出正确命题,却常在关键处卡壳。经过人机配合,终于生成1125行被验证的证明。

来自主题: AI技术研报
9958 点击    2025-11-06 09:37
啥?陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了

啥?陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了

啥?陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了

不得了,这个名叫Gauss(高斯)的新AI Agent,有点杀疯了的感觉。 因为它只用了三周的时间,就完成了陶哲轩和Alex Kontorovich提出的数学挑战——在Lean中形式化强素数定理(Prime Number Theorem,PNT)。

来自主题: AI资讯
10545 点击    2025-09-14 13:30
超越DeepSeek-R1,数学形式化准确率飙升至84% | 字节&南大开源

超越DeepSeek-R1,数学形式化准确率飙升至84% | 字节&南大开源

超越DeepSeek-R1,数学形式化准确率飙升至84% | 字节&南大开源

当人工智能已经能下围棋、写代码,如何让机器理解并证明数学定理,仍是横亘在科研界的重大难题。

来自主题: AI技术研报
10817 点击    2025-07-30 11:01
速递|企业AI搜索Glean获F轮融资1.5亿美元估值72亿,ARR突破1亿美元

速递|企业AI搜索Glean获F轮融资1.5亿美元估值72亿,ARR突破1亿美元

速递|企业AI搜索Glean获F轮融资1.5亿美元估值72亿,ARR突破1亿美元

企业搜索聊天机器人开发商 Glean 在威灵顿管理公司领投的 F 轮融资中筹集了 1.5 亿美元。这再次表明投资者对企业搜索市场的乐观态度,该领域还有亚马逊云服务、谷歌、Snowflake 等竞争者参与角逐。

来自主题: AI资讯
7968 点击    2025-06-11 14:46