AI资讯新闻榜单内容搜索-AI数学

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI数学
陶哲轩最新灵魂拷问:AI几乎完全由实证研究主导,学术界完全隐身

陶哲轩最新灵魂拷问:AI几乎完全由实证研究主导,学术界完全隐身

陶哲轩最新灵魂拷问:AI几乎完全由实证研究主导,学术界完全隐身

陶哲轩最新发文总结AI领域现状,当前AI发展高度依赖经验与算力,缺乏理论支撑,导致成功难以复制、失败无法解释。辛顿、Rahimi、Jordan等也纷纷警示,AI的黑箱本质和缺乏解释性将限制其可持续发展。唯有建立坚实理论基础,AI才能真正走向透明、安全与可靠的未来。

来自主题: AI资讯
5449 点击    2025-08-05 15:50
2025 IMO真题撕碎AI数学神话,全球顶尖模型齐翻车!冠军铜牌都拿不到

2025 IMO真题撕碎AI数学神话,全球顶尖模型齐翻车!冠军铜牌都拿不到

2025 IMO真题撕碎AI数学神话,全球顶尖模型齐翻车!冠军铜牌都拿不到

AI做奥数的神话,刚刚被戳破了!最新出炉的2025 IMO数学竞赛中,全球顶尖AI模型无一例外翻车了。即便是冠军Gemini也只拿下可怜的31分,连铜牌都摸不到。Grok-4更是摆烂到底,连DeepSeek-R1都令人失望。看来,AI想挑战人类奥数大神,还为时尚早。

来自主题: AI资讯
6112 点击    2025-07-18 17:37
全球最强开源「定理证明器」出世!十位华人核心,8B暴击671B DeepSeek

全球最强开源「定理证明器」出世!十位华人核心,8B暴击671B DeepSeek

全球最强开源「定理证明器」出世!十位华人核心,8B暴击671B DeepSeek

迄今为止最强大的开源定理证明器登场!Goedel-Prover-V2仅用8B参数击败671B的DeepSeek-Prover,并再次夺下数学PutnamBench冠军。十位核心贡献者,八大顶尖机构,让AI形式化证明再破纪录。

来自主题: AI资讯
5195 点击    2025-07-18 13:24
普林斯顿团队领衔发布最强开源数学定理证明模型:32B性能大幅超越前代SOTA DeepSeek 671B

普林斯顿团队领衔发布最强开源数学定理证明模型:32B性能大幅超越前代SOTA DeepSeek 671B

普林斯顿团队领衔发布最强开源数学定理证明模型:32B性能大幅超越前代SOTA DeepSeek 671B

近日,由普林斯顿大学牵头,联合清华大学、北京大学、上海交通大学、斯坦福大学,以及英伟达、亚马逊、Meta FAIR 等多家顶尖机构的研究者共同推出了新一代开源数学定理证明模型——Goedel-Prover-V2。

来自主题: AI资讯
6762 点击    2025-07-18 11:17
陶哲轩罕见长长长长长访谈:数学、AI和给年轻人的建议

陶哲轩罕见长长长长长访谈:数学、AI和给年轻人的建议

陶哲轩罕见长长长长长访谈:数学、AI和给年轻人的建议

陶哲轩罕见接受了一次长长长长访谈,把他关于数学、AI、教育和人类智慧的最新认知,都对外分享了。

来自主题: AI资讯
6660 点击    2025-06-21 18:22
大模型“拼好题”,45K数据撬动18%提升,数学问题拒绝死记硬背 | MathFusion

大模型“拼好题”,45K数据撬动18%提升,数学问题拒绝死记硬背 | MathFusion

大模型“拼好题”,45K数据撬动18%提升,数学问题拒绝死记硬背 | MathFusion

当前数学领域的数据生成方法常常局限于对单个问题进行改写或变换,好比是让学生反复做同一道题的变种,却忽略了数学题目之间内在的关联性。

来自主题: AI技术研报
7680 点击    2025-06-18 10:28
首个高考数学满分AI诞生!海淀名师审大题,给出惊艳超高分

首个高考数学满分AI诞生!海淀名师审大题,给出惊艳超高分

首个高考数学满分AI诞生!海淀名师审大题,给出惊艳超高分

高考数学满分AI出现了!豆包旗下的教育产品:豆包爱学首次公开挑战高考数学全国卷,由6位资深名师严格把关,主观题步骤全打分,竟然斩获Ⅰ卷144分、Ⅱ卷150分满分战绩。这个惊艳的成绩或许预示着,AI教育真要变天了。

来自主题: AI资讯
7522 点击    2025-06-17 18:52
高考数学斩获139分!小米7B模型比肩Qwen3-235B、OpenAI o3

高考数学斩获139分!小米7B模型比肩Qwen3-235B、OpenAI o3

高考数学斩获139分!小米7B模型比肩Qwen3-235B、OpenAI o3

上上周的 2025 高考已经落下了帷幕!在人工智能领域,各家大模型向数学卷发起了挑战。

来自主题: AI技术研报
8273 点击    2025-06-16 17:04
DeepMind首个猜想库开源,获陶哲轩力挺!

DeepMind首个猜想库开源,获陶哲轩力挺!

DeepMind首个猜想库开源,获陶哲轩力挺!

谷歌DeepMind重磅出击,开源首个形式化数学猜想库,获陶哲轩力挺!从解析数论的兰道猜想开始,这个开源项目将为AI破解数学难题的未来铺路。

来自主题: AI技术研报
5731 点击    2025-06-12 18:03
103K「硬核」题,让大模型突破数学推理瓶颈

103K「硬核」题,让大模型突破数学推理瓶颈

103K「硬核」题,让大模型突破数学推理瓶颈

本文将介绍 DeepMath-103K 数据集。该工作由腾讯 AI Lab 与上海交通大学团队共同完成。

来自主题: AI技术研报
8281 点击    2025-06-11 14:50