AI资讯新闻榜单内容搜索-模型训练

快手可灵提出VLM-as-Teacher：用测试时在线优化，让视频生成模型学会按规则推理

怎么让VGM学会按规则推理？过去主要有两条路。两条路，一个不动模型，一个只写文字，都没真正解决“执行”问题。为此，城大×快手可灵提出了第三条路：VLM-as-Teacher。

来自主题: AI技术研报

8140 点击 2026-06-06 09:51

来自中国科学院计算技术研究所、ETH Zurich等机构的研究者提出了Fast-SAM3D。该方法直接面向SAM3D的推理链路做训练无关加速，在最大程度保持重建质量的同时，将单对象生成提速最高2.67倍，场景生成提速最高2.01倍。

来自主题: AI技术研报

8355 点击 2026-06-06 09:45

“完全抛弃传统的代码编辑器，我直接告诉 AI 去修改代码。”

来自主题: AI资讯

7598 点击 2026-06-05 09:53

长上下文模型越来越能“记”，但真正让它们跑到线上时，最先顶不住的往往不是算力，而是KV Cache。

来自主题: AI技术研报

5954 点击 2026-06-05 09:53

我们今天以 PDF 写论文的方式，已经持续了三百多年。然而论文其实是把一段混乱反复、充满试错的真实研究，讲成一个干净利落、足以服人的完美故事。

来自主题: AI技术研报

10599 点击 2026-06-05 09:25

Notion 最近发了一篇工程文章，复盘过去两年他们怎么做向量搜索基础设施。

来自主题: AI资讯

8500 点击 2026-06-05 09:16

训练大模型时，工程师绝对不会指望网络做一次前向传播就能收敛。它需要数据喂养、Batch切分、学习率控制、验证集筛选以及优化器状态的迭代试错。

来自主题: AI技术研报

10571 点击 2026-06-05 09:13

当大模型 Agent 从实验室加速走向金融、医疗、代码开发等高价值场景，一个隐秘却致命的瓶颈正在浮现：Token 的指数级消耗正引发算力、协作与安全的系统性危机。传统 “堆算力、加参数” 的线性优化已触及天花板，我们该如何在 “输出质量” 与 “经济成本” 之间找到可持续的最优解？

来自主题: AI技术研报

8644 点击 2026-06-04 16:38

为解决科研中对单篇文献深度解析的需求，佐治亚大学团队提出IntrAgent，专注单篇内容，避免大模型幻觉。通过段落排序与迭代阅读机制，精准提取实验细节与元数据。

来自主题: AI技术研报

10643 点击 2026-06-04 16:38

赋予机器人物理理解和预测能力是通用操作的关键。蚂蚁灵波等机构提出的 LingBot-VA 试图将视频帧预测与动作推理统一起来，让机器人通过自回归扩散框架学会“一边思考一边行动”。

来自主题: AI技术研报

10745 点击 2026-06-04 09:13