AI资讯新闻榜单内容搜索-Math

让7B千问模型超越o1，微软rStar-Math惊艳登场，网友盛赞

OpenAI o1 给大模型规模扩展 vs 性能的曲线带来了一次上翘。它在大模型领域重现了当年 AlphaGo 强化学习的成功 —— 给越多算力，就输出越多智能，一直到超越人类水平。

来自主题: AI技术研报

8451 点击 2025-01-11 11:22

7B模型数学推理击穿o1，直逼全美20%尖子生！四轮进化，微软华人新作爆火

小模型也能击败o1？微软全华人团队提出rStar-Math算法，三大革命性技术突破，不仅让SLM在数学推理能力上刷新SOTA，更是挤进了全美20%顶尖高中生榜单。

来自主题: AI技术研报

5052 点击 2025-01-10 15:51

GPT-4o数学能力跑分直掉50%，上海AI Lab开始给大模型重新出题了

新模型在MATH上（以数学竞赛为主）动辄跑分80%甚至90%以上，却一用就废。

来自主题: AI技术研报

9655 点击 2024-12-19 10:28

陶哲轩对谈OpenAI高管：AI也能做数据稀疏推理，“也许很快OpenAI就能证明陶哲轩是错的”

数学大佬陶哲轩和OpenAI两位高管最近进行了一场线上对谈，主题为“The Future of Math with o1 Reasoning”，即以推理为主的o1模型如何与数学融合，从而解锁突破性的科学进步。

来自主题: AI技术研报

9885 点击 2024-12-08 14:39

数学这块，K0-math 真的可以回答一切

11 月 16 日，久未露面的月之暗面创始人杨植麟突然现身，召开了一场媒体发布会。

来自主题: AI资讯

5272 点击 2024-11-26 16:20

上交大o1复现新突破：蒸馏超越原版，警示AI研发"捷径陷阱"

自从 OpenAI 发布展现出前所未有复杂推理能力的 o1 系列模型以来，全球掀起了一场 AI 能力 “复现” 竞赛。近日，上海交通大学 GAIR 研究团队在 o1 模型复现过程中取得新的突破，通过简单的知识蒸馏方法，团队成功使基础模型在数学推理能力上超越 o1-preview。

来自主题: AI技术研报

7739 点击 2024-11-22 16:46

杨植麟还没有解开月之暗面的局

11月16日，陷入前投资人仲裁风波的主角杨植麟突然出现，并对外发布了一款数学模型。杨植麟将自己的数学模型k0-math对标OpenAI o1系列，主打深入思考。

来自主题: AI资讯

8227 点击 2024-11-21 14:30

杨植麟发布Kimi新模型：数学对标o1，中考高考考研成绩全第一

kimi全面开放一周年之际，创始人杨植麟亲自发布新模型—— 数学模型k0-math，对标OpenAI o1系列，主打深入思考。在MATH、中考、高考、考研4个数学基准测试中，k0-math成绩超过o1-mini和o1-preview。

来自主题: AI资讯

9330 点击 2024-11-16 21:16

o1/Claude集体翻车！陶哲轩等60+顶尖数学家合力提出新数学基准，大模型正确率通通不足2%

让大模型集体吃瘪，数学题正确率通通不到2%！

来自主题: AI技术研报

8365 点击 2024-11-12 11:07

陶哲轩联手60多位数学家出题，世界顶尖模型通过率仅2%！专家级数学基准，让AI再苦战数年

Epoch AI推出数学基准FrontierMath，目前前沿模型测试成功率均低于2%！OpenAI研究科学家Noam Brown说道：「我喜欢看到新评估的前沿模型通过率如此之低。这种感觉就像一觉醒来，外面是一片崭新的雪地，完全没有人迹。」或许，FrontierMath测试成功率突破的那一天，会是AI发展过程中一个全新的里程碑。

来自主题: AI技术研报

6630 点击 2024-11-11 15:10