AI资讯新闻榜单内容搜索-Kaggle

谷歌DeepMind首发AGI终极考纲！20万全球悬赏，撕下所有大模型伪装

AGI，究竟如何评判？刚刚，谷歌DeepMind发出重磅论文，直接从认知科学「借」了一套度量衡——把通用智能拆成10大认知能力，配一套三阶段评估协议，还联合Kaggle砸了20万美金，向全球研究者悬赏：谁能测出真正的AGI？

来自主题: AI资讯

9504 点击 2026-03-18 16:16

12小时登顶OpenAI MLE-bench！上海AI Lab开源算法进化框架MLEvolve

让AI像Kaggle顶尖选手一样设计算法，需要几步？

来自主题: AI技术研报

8365 点击 2026-03-11 10:02

谷歌的两个5天课程都讲了什么，介绍一下这9+N份白皮书｜最新

2025年末，谷歌通过Kaggle平台，以前所未有的力度，连续推出了两个为期五天的线上强化课程。这不仅仅是两次普通的线上分享，更像是一场由谷歌顶级机器学习（ML）研究员和工程师亲自引领的、深入探索生成式AI及其前沿应用——AI Agents（人工智能代理）的集训。

来自主题: AI技术研报

11706 点击 2025-11-12 10:21

刚刚，大模型棋王诞生！40轮血战，OpenAI o3豪夺第一，人类大师地位不保？

继Kaggle Game Arena的淘汰赛后，国际象棋积分赛成果出炉！OpenAI o3以人类等效Elo 1685分傲视群雄，而Grok 4和Gemini 2.5 Pro紧随其后。DeepSeek R1和GPT-4.1、Claude Sonnet-4、Claude Opus-4并列第五。

来自主题: AI资讯

8451 点击 2025-08-23 13:17

OpenAI o3封王，4比0横扫马斯克Grok 4！全球大模型对抗赛完美收官

决赛前，它是沉默、精准、不可一世的冠军候选；决赛后，它成了连续送子、失误连连的背景板。Grok 4经历了从神坛到谷底的戏剧性一天，它的轰然倒塌，也成就了o3的不败王者神话。

来自主题: AI资讯

8927 点击 2025-08-09 12:12

4比0横扫Grok 4，o3强势夺冠，首届大模型对抗赛结果出炉

备受 AI 圈关注的首届谷歌 Kaggle AI Chess 大赛（也即大模型国际象棋对抗赛）迎来了最终赢家。就在昨天，Grok 4 携手 OpenAI o3 进入了决赛。在机器之心的投票中，大家更倾向于 o3 战胜 Grok 4。

来自主题: AI资讯

9840 点击 2025-08-09 10:05

您猜怎么着？Grok 4进决赛，大模型对抗赛Gemini全军覆没，马斯克「装」起来了

明天，Grok 对阵 OpenAI 的 o3。谁也没想到，谷歌攒的 Kaggle AI Chess 比赛（即大模型国际象棋对抗赛），在半决赛中，Grok 4 击败 Gemini 2.5 Pro，进入总决赛！

来自主题: AI资讯

9352 点击 2025-08-07 18:30

爆冷！首届大模型争霸，Grok 4下出「神之一手」？DeepSeek、Kimi惨遭淘汰

AI国际象棋对抗？这次玩真的！谷歌Kaggle推出首届全球AI象棋争霸赛，八款顶级语言模型正面对抗，胜负只在一步之间！

来自主题: AI资讯

9630 点击 2025-08-07 12:05

战报：马斯克Grok4笑傲AI象棋大赛，DeepSeek没干过o4-mini，Kimi K2被喊冤

最新战报最新战报：首届AI国际象棋对战……马斯克家的Grok 4“遥遥领先”了。是的，谷歌给大模型整了个国际象棋比赛：Kaggle AI象棋竞赛。

来自主题: AI资讯

8042 点击 2025-08-07 10:42

大模型“天梯赛”来了，让Agent在Kaggle真实任务中进化｜佐治亚理工、斯坦福开源

当前最强大的大语言模型（LLM）虽然代码能力飞速发展，但在解决真实、复杂的机器学习工程（MLE）任务时，仍像是在进行一场“闭卷考试”。它们可以在单次尝试中生成代码，却无法模拟人类工程师那样，在反复的实验、调试、反馈和优化中寻找最优解的真实工作流。

来自主题: AI技术研报

8215 点击 2025-07-27 12:43

AI资讯新闻榜单内容搜索-Kaggle

谷歌DeepMind首发AGI终极考纲！20万全球悬赏，撕下所有大模型伪装

12小时登顶OpenAI MLE-bench！上海AI Lab开源算法进化框架MLEvolve

谷歌的两个5天课程都讲了什么，介绍一下这9+N份白皮书 ｜最新

刚刚，大模型棋王诞生！40轮血战，OpenAI o3豪夺第一，人类大师地位不保？

OpenAI o3封王，4比0横扫马斯克Grok 4！全球大模型对抗赛完美收官

4比0横扫Grok 4，o3强势夺冠，首届大模型对抗赛结果出炉

您猜怎么着？Grok 4进决赛，大模型对抗赛Gemini全军覆没，马斯克「装」起来了

爆冷！首届大模型争霸，Grok 4下出「神之一手」？DeepSeek、Kimi惨遭淘汰

战报：马斯克Grok4笑傲AI象棋大赛，DeepSeek没干过o4-mini，Kimi K2被喊冤

大模型“天梯赛”来了，让Agent在Kaggle真实任务中进化｜佐治亚理工、斯坦福开源

谷歌的两个5天课程都讲了什么，介绍一下这9+N份白皮书｜最新