AI资讯新闻榜单内容搜索-ARC-AGI-2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: ARC-AGI-2
Gemini 3.1 Pro 曝光,能力翻倍价格不变,谷歌想重新定义 AI 竞争规则

Gemini 3.1 Pro 曝光,能力翻倍价格不变,谷歌想重新定义 AI 竞争规则

Gemini 3.1 Pro 曝光,能力翻倍价格不变,谷歌想重新定义 AI 竞争规则

当地时间 2 月 19 日,Google 曝光 Gemini 3.1 Pro 最新模型。在 ARC-AGI-2 这个公认的推理基准测试中,Gemini 3.1 Pro 拿到了 77.1% 的分数。什么概念?它的前辈 Gemini 3 Pro 只有 31.1%,就连专门用来「深度思考」的 Gemini 3 Deep Think 也只有 45.1%。

来自主题: AI资讯
8554 点击    2026-02-20 13:53
刚刚谷歌发布 Gemini 3.1 Pro

刚刚谷歌发布 Gemini 3.1 Pro

刚刚谷歌发布 Gemini 3.1 Pro

今天凌晨,Google 发布 Gemini 3.1 Pro。核心提升在推理能力,ARC-AGI-2(抽象推理基准)从 3 Pro 的 31.1% 跳到 77.1%,翻了一倍多,GPQA Diamond(科学知识推理)从 91.9% 提到 94.3%

来自主题: AI资讯
10347 点击    2026-02-20 02:47
GPT-5.2考赢人类!OpenAI警告:大模型能力已过剩,AGI天花板不是AI

GPT-5.2考赢人类!OpenAI警告:大模型能力已过剩,AGI天花板不是AI

GPT-5.2考赢人类!OpenAI警告:大模型能力已过剩,AGI天花板不是AI

刚刚,GPT-5.2刷新了一项新纪录!OpenAI联合创始人Greg Brockman发帖称使用GPT-5.2在ARC-AGI-2基准测试上,表现超过了人类基线水平。

来自主题: AI资讯
10402 点击    2026-01-11 10:10
6位前DeepMind老将打造「AI指挥官」,一半成本刷新SOTA

6位前DeepMind老将打造「AI指挥官」,一半成本刷新SOTA

6位前DeepMind老将打造「AI指挥官」,一半成本刷新SOTA

6位前DeepMind成员以元系统重塑大模型调用方式,该系统推出的Gemini 3 Pro优化技术在ARC-AGI-2上以54%的成绩夺得榜首,而成本仅为此前最优方法的一半。

来自主题: AI技术研报
8334 点击    2025-12-15 11:31
全球顶级模型集体0分,AI终极大考人类5分钟秒杀!Keras之父戳破AGI神话

全球顶级模型集体0分,AI终极大考人类5分钟秒杀!Keras之父戳破AGI神话

全球顶级模型集体0分,AI终极大考人类5分钟秒杀!Keras之父戳破AGI神话

AI界「智商大考」ARC-AGI-2重磅出炉了!一个人类用5分钟轻松解开的谜题,却让最顶尖LLM全线崩盘得分挂零,o3更是从曾经76%暴跌至4%。它正式宣告,人类还未实现AGI。

来自主题: AI技术研报
8845 点击    2025-03-25 17:53