AI资讯新闻榜单内容搜索-训练

在失败中进化？UIUC联合斯坦福、AMD实现智能体「从错误中成长」

伊利诺伊大学厄巴纳 - 香槟分校（UIUC）等团队近日发布论文，系统性剖析了 LLM 智能体失败的机制，并提出了可自我修复的创新框架 ——AgentDebug。该研究认为，AI 智能体应成为自身的观察者和调试者，不仅仅是被动的任务执行者，为未来大规模智能体的可靠运行和自动进化提供了理论与实践工具。

来自主题: AI技术研报

8249 点击 2025-11-07 15:01

NeurIPS 2025 Spotlight | 选择性知识蒸馏精准过滤：推测解码加速器AdaSPEC来了

目前，最先进的对齐方法是使用知识蒸馏（Knowledge Distillation, KD）在所有 token 上最小化 KL 散度。然而，最小化全局 KL 散度并不意味着 token 的接受率最大化。由于小模型容量受限，草稿模型往往难以完整吸收目标模型的知识，导致直接使用蒸馏方法的性能提升受限。在极限场景下，草稿模型和目标模型的巨大尺寸差异甚至可能导致训练不收敛。

来自主题: AI技术研报

9114 点击 2025-11-07 14:57

北大团队让AI学会考古！全球首个古希腊陶罐3D视觉问答数据集发布，还配了专用模型

现在AI都懂文物懂历史了。一项来自北京大学的最新研究引发关注：他们推出了全球首个面向古希腊陶罐的3D视觉问答数据集——VaseVQA-3D，并配套推出了专用视觉语言模型VaseVLM。这意味着，AI正在从“识图机器”迈向“文化考古Agent”。

来自主题: AI技术研报

9029 点击 2025-11-07 14:49

如何自动优化领域任务的提示词？用EGO-Prompt｜NeurIPS 2025

大型语言模型（LLMs）正迅速成为从金融到交通等各个专业领域不可或缺的辅助决策工具。但目前LLM的“通用智能”在面对高度专业化、高风险的任务时，往往显得力不从心。

来自主题: AI技术研报

8671 点击 2025-11-07 10:52

RLinf上新πRL：在线强化学习微调π0和π0.5

近年来，基于流匹配的 VLA 模型，特别是 Physical Intelligence 发布的 π0 和 π0.5，已经成为机器人领域备受关注的前沿技术路线。流匹配以极简方式建模多峰分布，能够生成高维且平滑的连续动作序列，在应对复杂操控任务时展现出显著优势。

来自主题: AI技术研报

11814 点击 2025-11-07 10:17

Feed-Forward 3D综述：三维视觉如何「一步到位」

在 3D 视觉领域，如何从二维图像快速、精准地恢复三维世界，一直是计算机视觉与计算机图形学最核心的问题之一。从早期的 Structure-from-Motion (SfM) 到 Neural Radiance Fields (NeRF)，再到 3D Gaussian Splatting (3DGS)，技术的演进让我们离实时、通用的 3D 理解越来越近。

来自主题: AI技术研报

7431 点击 2025-11-07 10:15