AI资讯新闻榜单内容搜索-模型训练

CVPR 2026 Oral｜横扫室内3D场景，港科大（广州）打造单目开放词汇占据预测新SOTA

在具身智能研究中，如何让智能体精准理解周围环境的精细几何结构与开放语义信息，始终是具身感知的核心难题。近年来，语义占据预测（Semantic Occupancy Prediction）将稠密几何与语义信息统一到三维体素网格中，用于构建 3D 语义占据地图，为机器人的空间推理、导航与交互操作提供了场景表达基础。

来自主题: AI技术研报

10390 点击 2026-05-06 09:07

Agent-World：扩展真实世界环境，让智能体与环境协同进化！

随着MCP、Agent Skills与各类Harness的快速发展，大模型能轻松调用成百上千种外部工具，但在多工具，具备复杂状态、长程交互的任务上仍有明显短板。尽管一系列环境扩展方法尝试复刻真实世界的交互环境（如订票系统，外卖平台），但仍受限于环境扩展的规模与真实性。

来自主题: AI技术研报

6402 点击 2026-05-06 09:06

非常抽象：一群AI研究员给模型制造了让它们上瘾的毒品

2026年，一群AI研究者给模型制造了毒品。没错，论文中就叫毒品——AI Drugs。他们生成了一些256×256像素的图片，这些我们看着全是毫无意义的色块。但AI看了之后表现得近乎狂喜——它自己报告的幸福感飙到6.5/7。

来自主题: AI技术研报

9240 点击 2026-05-05 22:19

700多个「坏模型」喂出AI测谎仪？Anthropic审计神器让AI自曝黑料

Anthropic让AI开口「招供」了。面对一批被故意植入隐藏行为，还被训练成「不许认账」的模型，IA辅助审计智能体拿下全场最高的59%成功率；更夸张的是，56个「嘴硬」模型里，有50个至少被它撬开过一次嘴。AI安全审计的游戏规则，悄悄变了。

来自主题: AI资讯

8008 点击 2026-05-05 13:49

顶级AI撞上低级乌龙：连写几十页推导，结果发现题干错了？

Google DeepMind再次血洗数学圈！700个地狱级难题被丢进Gemini的熔炉，结果让数学家集体破防：这哪是证明，这分明是「逻辑拆迁」。DeepMind这一波不仅贴脸爆杀了OpenAI，还砸烂了人类所有的优越感。

来自主题: AI技术研报

6836 点击 2026-05-05 09:59

UC伯克利联合斯坦福提出「Combee」：蜂群Agent的Prompt Learning正式进入并行时代！

UC伯克利联合斯坦福提出的Combee，正是为此而来。它把Prompt Learning从低并发、顺序式更新，推进到高并发、分布式经验聚合，并已在ACE和GEPA中完成验证。

来自主题: AI技术研报

8377 点击 2026-05-05 09:48

DeepSeek做大→Mega MoE，Tri Dao团队加快→SonicMoE

近日，由普林斯顿大学 Tri Dao（FlashAttention 的一作）和加州大学伯克利分校 Ion Stoica 领导的一个联合研究团队也做出了一个超快的索尼克：SonicMoE。据介绍，SonicMoE 能在英伟达 Blackwell GPU 上以峰值吞吐量运行！并且运算性能超过了 DeepSeek 之前开源并引发巨大轰动的 DeepGEMM。

来自主题: AI技术研报

7986 点击 2026-05-04 10:17