AI资讯新闻榜单内容搜索-训练

AI集体“听不懂”！MMAR基准测试揭示音频大模型巨大短板

用AI来整理会议内容，已经是人类的常规操作。不过，你猜怎么着？面对1000道多步骤音频推理题时，30款AI模型竟然几乎全军覆没，很多开源模型表现甚至接近瞎猜。

来自主题: AI技术研报

9674 点击 2025-06-09 14:43

2024年，伯克利人工智能研究中心（BAIR）率先提出了一个新概念——复合人工智能系统（Compound AI Systems，简称CAIS）。这个看似简单的术语背后，蕴含着AI系统架构的根本性改变：不再依赖单一LLM的"超级大脑"，而是构建多组件协同的"智能生态系统"。

来自主题: AI技术研报

8552 点击 2025-06-09 11:32

当前，强化学习（RL）在提升大语言模型（LLM）推理能力方面展现出巨大潜力。DeepSeek R1、Kimi K1.5 和 Qwen 3 等模型充分证明了 RL 在增强 LLM 复杂推理能力方面的有效性。

来自主题: AI技术研报

7924 点击 2025-06-09 11:02

苹果最新大模型论文，在AI圈炸开了锅。有人总结到：苹果刚刚当了一回马库斯，否定了所有大模型的推理能力。

来自主题: AI技术研报

7985 点击 2025-06-09 10:38

Test time scaling范式蓬勃发展。推理模型持续快速改进，变得更为高效且价格更为亲民。在评估现实世界软件工程任务（如 SWE-Bench）时，模型以更低的成本取得了更高的分数。以下是显示模型变得更便宜且更优秀的图表。

来自主题: AI技术研报

6877 点击 2025-06-09 10:25

注意力机制的「平方枷锁」，再次被撬开！一招Fenwick树分段，用掩码矩阵，让注意力焕发对数级效率。更厉害的是，它无缝对接线性注意力家族，Mamba-2、DeltaNet 全员提速，跑分全面开花。长序列处理迈入log时代！

来自主题: AI技术研报

9167 点击 2025-06-08 15:27

图神经网络还能更聪明？思维链提示学习来了！

来自主题: AI技术研报

7527 点击 2025-06-08 15:17

该项目来自百家 AI，是北京邮电大学白婷副教授所指导的研究小组，团队致力于为硅基人类倾力打造情感饱满、记忆超凡的智慧大脑。

来自主题: AI技术研报

9176 点击 2025-06-08 15:07

多模态检索是信息理解与获取的关键技术，但其中的跨模态干扰问题一直是一大难题。

来自主题: AI技术研报

7637 点击 2025-06-08 14:46

最近的一篇论文中，来自人大和腾讯的研究者们的研究表明，语言模型对强化学习中的奖励噪音具有鲁棒性，即使翻转相当一部分的奖励（例如，正确答案得 0 分，错误答案得 1 分），也不会显著影响下游任务的表现。

来自主题: AI技术研报

7831 点击 2025-06-08 14:35