AI资讯新闻榜单内容搜索-AI数学

震撼全网，AlphaEvolve矩阵乘法突破被证明为真！开发者用代码证实

太震撼了，有开发者代码实证后发现，谷歌AlphaEvolve的矩阵乘法突破，被证明为真！Claude辅助下，他成功证明，它果然仅用了48次乘法，就正确完成了4×4矩阵的乘法运算。接下来，可以坐等AlphaEvolve更「奇点」的发现了。

来自主题: AI技术研报

11867 点击 2025-05-20 10:58

陶哲轩YouTube视频第二弹震撼来袭！这一次，他让AI挑战在Lean中形式化代数蕴含证明，结果Claude约20分通关，o4-mini太过谨慎直接「弃赛」。

来自主题: AI资讯

8258 点击 2025-05-15 12:08

菲尔兹奖得主陶哲轩再放大招，仅数天时间，开源的概念验证工具借助Copilot迭代至2.0版本。而在最新视频中，他甚至用AI在33分钟「盲做」形式化一页证明，效率惊人。

来自主题: AI技术研报

11275 点击 2025-05-12 12:24

本周二，我们报道了菲尔兹奖得主陶哲轩的一个开源项目 —— 在大模型的协助下编写了一个概念验证软件工具，来验证涉及任意正参数的给定估计是否成立（在常数因子范围内）。这才几天的时间，这个估计验证工具的 2.0 版本就来了！

来自主题: AI资讯

9418 点击 2025-05-11 15:22

最强AI模型面对5560道数学难题，成功率仅16.46%？背后真相大揭秘。

来自主题: AI技术研报

10485 点击 2025-05-08 10:36

DeepSeek放大招！新模型专注数学定理证明，大幅刷新多项高难基准测试。在普特南测试上，新模型DeepSeek-Prover-V2直接把记录刷新到49道。目前的第一名在657道题中只做出10道题，为Kimi与AIME2024冠军团队Numina合作成果Kimina-Prover。

来自主题: AI技术研报

10413 点击 2025-05-01 22:52

AIMO2冠军「答卷」公布了！英伟达团队NemoSkills拔得头筹，开源了OpenMath-Nemotron系列AI模型，1.5B小模型击败14B-DeepSeek「推理大模型」！

来自主题: AI技术研报

8981 点击 2025-04-26 17:17

AI辅助人类，完成了首个非平凡研究数学证明，破解了50年未解的数学难题！在南大校友的研究中，这个难题中q=3的情况，由o3-mini-high给出了精确解。

来自主题: AI技术研报

9579 点击 2025-04-14 17:10

AIMO2最终结果出炉了！英伟达团队NemoSkills拔得头筹，凭借14B小模型破解了34道奥数题，完胜DeepSeek R1。

来自主题: AI资讯

8711 点击 2025-04-14 11:42

在数学推理中，大语言模型存在根本性局限：在美国数学奥赛，顶级AI模型得分不足5%！来自ETH Zurich等机构的MathArena团队，一下子推翻了AI会做数学题这个神话。

来自主题: AI技术研报

10303 点击 2025-04-02 14:58