AI资讯新闻榜单内容搜索-模型训练

大模型再爆弱点！旧记忆忘不掉，新记忆分不出，准确率暴降 | ICML'25

大模型有苦恼，记性太好，无法忘记旧记忆，也区分不出新记忆！基于工作记忆的认知测试显示，LLM的上下文检索存在局限。在一项人类稳定保持高正确率的简单检索任务中，模型几乎一定会混淆无效信息与正确答案。

来自主题: AI技术研报

7823 点击 2025-07-21 10:27

MiniMax 技术闭门会分享：长上下文是 Agent 的 Game Changer

MiniMax 在 7 月 10 日面向全球举办了 M1 技术研讨会，邀请了来自香港科技大学、滑铁卢大学、Anthropic、Hugging Face、SGLang、vLLM、RL领域的研究者及业界嘉宾，就模型架构创新、RL训练、长上下文应用等领域进行了深入的探讨。

来自主题: AI资讯

9432 点击 2025-07-20 12:37

大模型竞赛转向：决胜关键为何是“后训练”？

随着基础大模型在通用能力上的边际效益逐渐递减、大模型技术红利向产业端渗透，AI的技术范式也开始从原来的注重“预训练”向注重“后训练”转移。后训练（Post-training），正从过去锦上添花的“调优”环节，演变为决定模型最终价值的“主战场”。

来自主题: AI技术研报

9192 点击 2025-07-20 12:30

超越O4-mini，多模态大模型终于学会回头「看」：中科院自动化所提出GThinker模型

尽管多模态大模型在数学、科学等结构化任务中取得了长足进步，但在需要灵活解读视觉信息的通用场景下，其性能提升瓶颈依然显著。

来自主题: AI技术研报

8250 点击 2025-07-20 11:50

OpenAI核心研究员：比提示词工程更重要的，是spec-writing

程序员最有价值的技能已经不再是编写代码了，而是精确地向 AI 传达意图。一份完善的规范才是包含完整意图的真正「源代码」。

来自主题: AI资讯

8088 点击 2025-07-20 11:44

无需NeRF/高斯点后处理，视频秒变游戏模型成现实！新方法平均每帧仅需60秒 | ICCV 2025

只需一段视频，就可以直接生成可用的4D网格动画？！来自KAUST的研究团队提出全新方法V2M4，能够实现从单目视频直接生成高质量、显式的4D网格动画资源。

来自主题: AI技术研报

7207 点击 2025-07-20 11:21

真实物理加持，人物动画再也不像塑料人！UIUC华人让角色活起来了 | ICCV'25

PhysRig是UIUC与Stability AI联合提出的首个面向角色动画的可微物理绑定框架。通过将刚性骨架嵌入弹性软体体积，并使用Material Point Method（MPM）进行可微分物理模拟，PhysRig能够自然还原皮肤、脂肪、尾巴等柔性结构的变形过程，显著提升角色动画的真实感，解决传统LBS无法克服的体积丢失与变形伪影问题。

来自主题: AI技术研报

9205 点击 2025-07-20 11:13