AI资讯新闻榜单内容搜索-模型训练

2026，Agent死于上下文失焦（附7大Claude Code 记忆遗忘与管理工具）

搭了个agent，结果该被记住的历史交互经验一点没记住，不该被记住的工具调用结果、过程输出被一股脑塞进上下文，导致输出质量下滑，类似的上下文失焦问题，这是多少人做agent时候的噩梦？

来自主题: AI技术研报

7633 点击 2026-04-30 08:35

龙虾冲浪终于不迷路了！网页智能体新框架Avenir-Web开源即SOTA

伦敦大学学院（UCL）、普林斯顿大学和爱丁堡大学的研究团队联合推出了Avenir-Web，让现有多模态模型像人类一样使用网页。现有的Web Agent在面对复杂的网页结构（如 iframe、Shadow DOM）时，往往会陷入“定位不准”“缺乏常识”或“走着走着就忘了”的窘境。

来自主题: AI技术研报

8247 点击 2026-04-30 08:32

成功率最高暴跌36.9%！南洋理工首个“模糊指令”测试，直击具身智能落地软肋

在语言学中，人类之所以能听懂“那个东西”、“它”、“这个重物”，依赖于桥接推理理论 (bridging inference)，即通过上下文信息在已有记忆与当前表达之间建立联系，从而恢复指代对象。

来自主题: AI技术研报

6276 点击 2026-04-29 09:55

ICLR 2026 Oral | 没人诱导，大模型也会「骗人」

新加坡国立大学 Bingsheng He 教授团队一篇最新入选 ICLR 2026 Oral 的论文，把视角放在了一个更贴近日常使用场景的问题上：人们更熟悉的，是用户故意诱导模型说假话的情形；而这篇工作真正追问的是，在没有刻意诱导、只是正常提问的情况下，模型会不会也出现某种 “表面这样答，实际那样想” 的现象。

来自主题: AI技术研报

6699 点击 2026-04-29 09:48

LangFlow: 挑战离散扩散，探索下一代语言模型新范式

主要作者团队：Yuxin Chen 现为伊利诺伊大学厄巴纳 - 香槟分校（UIUC）硕士一年级学生，Chumeng Liang 为 UIUC 博士一年级学生，Hangke Sui 为 UIUC 博士二年级学生，Ge Liu 为 UIUC 计算机系助理教授。Liu Lab 团队长期聚焦扩散 / 流模型方向，

来自主题: AI技术研报

6973 点击 2026-04-29 09:36

ACL 2026 | LCA：DeepSeek 长文本加速神器，90% KV 缓存缩减 + 2.5 倍推理提速

近日，琶洲实验室、华南理工大学、蔻町（AIGCode）等单位科研团队联合提出潜在空间压缩注意力（Latent-Condensed Attention，LCA），研究成果入选 ACL 2026。

来自主题: AI技术研报

8226 点击 2026-04-29 09:35

流式意图检测+永久记忆，NUS&NTU发布Pask：把贾维斯AI拉进现实

让AI像助手一样主动帮助，才是我们心中AGI的样子。主动智能体的概念已经被多次提出，但都很难做到可以真正在生活中落地。现有的工作都还停留在概念层面，无法解决复杂世界中所要求的实时性、深度、和记忆等问题。南洋理工大学谢之非团队提出Pask，使用「底层小模型流式意图检测」+ 「上层Agents执行」架构，实现首个能够做到实时、有深度、基于个人全局记忆自进化的主动智能体。

来自主题: AI技术研报

7594 点击 2026-04-28 15:08

MiniCPM-o 4.5 技术报告发布：全双工全模态 API 开放，RTX5070即可实时运行

你有没有想过，不用联网、仅用一张消费级显卡，就能在个人电脑上拥有一个「边看、边听、边说、还能主动提醒」的类人 AI 助手？这就是 MiniCPM-o 4.5 所能做到的。在技术创新下，它仅凭 9B 参数，实现了业界首个端到端全双工全模态大模型，让端侧 AI 普惠成为现实。其自 2026 年 2 月模型发布以来，在 Hugging Face 上的下载量已突破 25 万+。

来自主题: AI技术研报

6947 点击 2026-04-28 13:15

不换GPU，性能飙升2.8倍！英伟达用软件暴打摩尔定律

MoE模型的稀疏激活本是优势，却常陷通信瓶颈。NVIDIA以软件为利剑，通过程序化依赖启动和全对全通信革新，在三个月内将GB200的单GPU吞吐提升2.8倍，真正释放Blackwell硬件潜力。

来自主题: AI技术研报

9167 点击 2026-04-28 10:09

AI「看不懂」、「做不好」视频的问题，混元用「MTSS」解决了

腾讯混元团队提出了 Multi-Stream Scene Script（MTSS），一种全新的视频描述范式 —— 将传统的 "一段话描述整个视频" 升级为 "多流结构化剧本"，通过 Stream Factorization 和 Relational Grounding 两大核心原则，让视频描述既忠实又可扩展，在视频理解和生成任务中均取得显著提升。

来自主题: AI技术研报

6583 点击 2026-04-28 09:57