AI资讯新闻榜单内容搜索-AI数学

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: AI数学
o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

就在刚刚,AIME 2025 I数学竞赛的大模型参赛结果出炉,o3-mini取得78%的最好成绩,DeepSeek R1拿到了65%,取得第四名。然而一位教授却发现,某些1.5B小模型竟也能拿到50%,莫非真的存在数据集污染?

来自主题: AI资讯
7970 点击    2025-02-10 11:21
天才解法震惊人类!谷歌AI破天荒摘得奥数金牌,横扫IMO 42道几何难题

天才解法震惊人类!谷歌AI破天荒摘得奥数金牌,横扫IMO 42道几何难题

天才解法震惊人类!谷歌AI破天荒摘得奥数金牌,横扫IMO 42道几何难题

谷歌DeepMind的AI,终于拿下IMO金牌了!六个月前遗憾摘银,如今一举得金,SKEST新算法立大功。这不,它首破解了2009 IMO最难几何题,辅助作图的神来之笔解法让谷歌研究员当场震惊。

来自主题: AI资讯
7839 点击    2025-02-10 11:17
o3拿下25%高分震惊数学教授,2025 IMO金牌或被AI收入囊中!

o3拿下25%高分震惊数学教授,2025 IMO金牌或被AI收入囊中!

o3拿下25%高分震惊数学教授,2025 IMO金牌或被AI收入囊中!

AI真的可以做数学了吗?来自帝国理工学院教授Kevin Buzzard在最新博文中深刻探讨了这个问题。甚至,他预测道,2025年AI能够拿下IMO金牌级水平。

来自主题: AI资讯
6668 点击    2025-01-01 17:36
一道题烧几千美元,OpenAI新模型o3:这34道题我真不会

一道题烧几千美元,OpenAI新模型o3:这34道题我真不会

一道题烧几千美元,OpenAI新模型o3:这34道题我真不会

前几天,OpenAI 已经完成了 12 连更的最后一更 —— 如外界所料,是新的推理系列模型 o3 和 o3-mini 。

来自主题: AI资讯
6102 点击    2024-12-29 18:47
让AI理解费马大定理的证明,两个月过去了,进展如何?

让AI理解费马大定理的证明,两个月过去了,进展如何?

让AI理解费马大定理的证明,两个月过去了,进展如何?

1637 年,费马在阅读丢番图《算术》拉丁文译本时,曾在第 11 卷第 8 命题旁写道:「将一个立方数分成两个立方数之和,或一个四次幂分成两个四次幂之和,或者一般地将一个高于二次的幂分成两个同次幂之和,这是不可能的。关于此,我确信我发现一种美妙的证法,可惜这里的空白处太小,写不下。」

来自主题: AI技术研报
6438 点击    2024-12-29 11:02
国产大模型2025考研数学排行榜:仅前两名成绩破百

国产大模型2025考研数学排行榜:仅前两名成绩破百

国产大模型2025考研数学排行榜:仅前两名成绩破百

2024 年就要结束了,在这一年里,大模型的智力水平究竟长进了多少? 上周日,2025考研初试刚刚结束,我们趁热拿考研数学卷子,去测测主流的几家国产大模型,看看他们的真实智商水平如何。

来自主题: AI资讯
7188 点击    2024-12-26 09:40
Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理

Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理

Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理

对 AI 研究者来说,数学既是一类难题,也是一个标杆,能够成为衡量 AI 技术的发展重要尺度。近段时间,随着 AI 推理能力的提升,使用 AI 来证明数学问题已经成为一个重要的研究探索方向。

来自主题: AI技术研报
6339 点击    2024-12-24 15:37