AI资讯新闻榜单内容搜索-Arc

这套题，GPT-5.5、Opus 4.7加起来没考到「1分」，人类却拿了满分100？

近日，ARC Prize 官方发布了针对这两款顶级模型的详细分析报告，结果令人震惊：在面对未见过的逻辑任务时，两者的表现得分均低于 1%，GPT-5.5 得分 0.43%，Claude Opus 4.7 得分 0.18%。

来自主题: AI技术研报

9433 点击 2026-05-02 15:00

谷歌掀桌：深度研究智能体进入自动驾驶时代

OpenAI刚用Deep Research抢了先手，谷歌直接掀桌！DeepMind祭出研究智能体双杀，Max版质量评分从66.1%暴拉到93.3%，知识工作自动化的军备竞赛正式进入贴身肉搏。

来自主题: AI资讯

8116 点击 2026-04-30 13:50

ACL 2026｜答得更准还写得更短？华为泰勒实验室提出SHAPE，给LLM推理装了个「推理税」

来自华为泰勒实验室、北京大学和上海财经大学的研究团队提出了 SHAPE（Stage-aware Hierarchical Advantage via Potential Estimation），给推理链装上了一套「里程碑 + 推理税」机制——不仅告诉模型每一步推得对不对，还让它为啰嗦付出代价。结果是：准确率平均提升 3%，token 消耗直降 30%。

来自主题: AI技术研报

8507 点击 2026-04-30 12:12

世界模型真正的壁垒，可能是表征压缩，对话SparcAI95后创始人李智昊、王雨飞

过去十年，压缩在 CV 学术圈一直是个边缘方向——做生成、做大模型才是显学。但 SparcAI 的两位95后创始人各自做了多年压缩，然后在同一间 NTU 实验室相遇，两年后发布了 Sparc3D。模型 demo 上线当日冲上 HuggingFace Trending 榜首，论文被 NeurIPS 2025 录用。如今他们创办了 SparcAI，目标是一家世界模型公司。

来自主题: AI资讯

9442 点击 2026-04-30 09:03

严肃聊聊，Skill到底能蒸馏我们的几分之几？｜Hao好聊趋势

2026 年初，浙江大学发表了一篇系统性的 SoK 论文《Agent Skills for Large Language Models: Architecture, Acquisition, Security, and the Path Forward》，给Skill下了一个正式定义。

来自主题: AI资讯

8697 点击 2026-04-28 15:08

斯坦福系视觉AI公司Collov，完成2300万美元A轮，押注摄像头是AI新入口

创始人张霄昨天，2026年4月23日，宣布融资2300万美元，也成立了Collov Labs Research，资金用于扩充研究团队和加速视觉AI系统研发，而非单纯的商业扩张。

来自主题: AI资讯

6359 点击 2026-04-26 12:11

GPT-5.5，刚刚泄露了

就在刚刚，Codex平台爆发重大泄漏事故，内部测试环境疑似误推生产环境。GPT-5.5、「风速狗」Arcanine、「海森堡」以及神秘的Glacier集体亮相。奥特曼口中那个「比Transformer更伟大的架构」，难道已经藏在这些模型背后？

来自主题: AI资讯

9275 点击 2026-04-23 15:26

理想同学 MindDR 1.5 发布：多智能体强化学习加持，深度研究更可靠

理想汽车信息智能体团队发布 MindDR 1.5，在 DeepResearch Bench 榜单中取得 52.54 分，以 30B 参数规模达到业界领先水平，性能优于同等规模的开源智能体系统。

来自主题: AI技术研报

6302 点击 2026-04-23 15:21

谷歌真急了！深夜更新Deep Research智能体，支持MCP、原生图表

谷歌真是急了。前脚刚传来消息，称谷歌联合创始人谢尔盖·布林重启“创始人模式”，亲自督战并组建精英“突击队”，全力提升Gemini在AI编程和自主智能体等关键能力上追赶Anthropic等对手。后脚

来自主题: AI资讯

8138 点击 2026-04-22 10:43

DeepSeek核心研究员郭达雅，曝入职字节

刚刚，图灵联合创始人刘江在海外社交媒体X上透露，DeepSeek核心研究院——郭达雅已加入字节跳动。郭达雅2023年博士毕业后加入DeepSeek，title是AI Researcher。公开论文显示，从 DeepSeek-Coder、DeepSeek-Math、DeepSeek-Prover、DeepSeek-V3到 DeepSeek-R1，他都出现在核心作者名单中。

来自主题: AI资讯

9085 点击 2026-04-16 08:00