AI资讯新闻榜单内容搜索-模型训练

Agent 真正的护城河，正在从工具转向记忆资产

2026 刚开年，Anthropic 就用 Claude Cowork 开启了 AI 行业新的创业热点。

来自主题: AI资讯

5913 点击 2026-01-28 10:16

「熟悉的陌生人」才是「好老师」？复旦提出简单指标，找出推理蒸馏中真正有教学价值的数据

什么样的思维链，能「教会」学生更好地推理？

来自主题: AI技术研报

9231 点击 2026-01-28 10:15

You are a helpful assistant只是高维空间中的一个脆弱坐标。牛津Anthropic联合发布

我们都在System Prompt里写过无数次 You are a helpful assistant，但你是否想过：这行文字在模型的残差流（Residual Stream）中究竟对应着怎样的几何结构？

来自主题: AI技术研报

6504 点击 2026-01-28 10:15

大模型哪里出问题、怎么修，这篇可解释性综述一次讲清

过去几年，机制可解释性（Mechanistic Interpretability）让研究者得以在 Transformer 这一 “黑盒” 里追踪信息如何流动、表征如何形成：从单个神经元到注意力头，再到跨层电路。但在很多场景里，研究者真正关心的不只是 “模型为什么这么答”，还包括 “能不能更稳、更准、更省，更安全”。

来自主题: AI技术研报

10082 点击 2026-01-28 10:13

高效智能体的「幕后推手」是谁？一篇综述带你从记忆×工具学习×规划看透

随着大模型能力的跃迁，业界关注点正在从 “模型能不能做” 快速转向 “智能体能不能落地”。过去一年可以看到大量工作在提升智能体的有效性（effectiveness）：如何让它更聪明、更稳、更会用工具、更能完成复杂任务。

来自主题: AI技术研报

7428 点击 2026-01-27 16:19

多模态大模型中Attention机制暗藏「骗局」，需用一个公式修正丨上大×南开

Attention真的可靠吗？

来自主题: AI技术研报

7988 点击 2026-01-27 16:17

思维链太长拖慢推理？把它「画」进隐空间！新框架RoT探索大模型隐空间推理新范式

在 LLM 时代，思维链（ CoT）已成为解锁模型复杂推理能力的关键钥匙。然而，CoT 的冗长问题一直困扰着研究者——中间推理步骤和解码操作带来了巨大的计算开销和显存占用，严重制约了模型的推理效率。

来自主题: AI技术研报

7023 点击 2026-01-27 16:17

斯坦福英伟达推出测试时强化学习：微调开源模型胜过顶级闭源模型，仅需几百美元

大模型持续学习，又有新进展！

来自主题: AI技术研报

8776 点击 2026-01-27 16:15

让Agent画思维导图稳固长期记忆：新框架实现稳定长期学习，准确率提升38%

思维导图曾被证明可以帮助学习障碍者快速提升成绩，那么当前已经可堪一用的智能体系统如果引入类似工具是否可以帮助改善长期学习记忆能力呢？有研究团队做出了探索性尝试。

来自主题: AI技术研报

5660 点击 2026-01-27 09:40

北大AI研究颠覆认知：我们看到的不是真实，而是被语言润色过的现实

近日，北京大学朱毅鑫教授课题组、北京大学毕彦超教授课题组和山西医科大学第一医院王效春团队通过结合 AI 模型和大脑损伤患者的数据，发现语言其实是一副无形的智能眼镜，时刻在悄悄修饰着我们看到的世界。我们可能以为视觉就是眼睛看到什么就是什么，但是这项成果说明了视觉从来都不是孤立的。事实上，当我们在看图片的时候，其实不只是在看，而是在进行被语言调制过的看。

来自主题: AI技术研报

7803 点击 2026-01-27 09:27