AI资讯新闻榜单内容搜索-训练

吃透大模型SFT底层机理：终结实践争议，规避无效算力

长期以来，监督微调（Supervised Fine-Tuning，SFT）一直是深度神经网络中最常用的模型适配手段。在中小规模的传统神经网络中，SFT 通常能够稳定提升下游任务表现。

来自主题: AI技术研报

6847 点击 2026-06-04 08:38

多模态模型终于不用「抽帧看世界」？LLaVA-OneVision-2.0全开源全帧率技术解读

由格灵深瞳灵感实验室主导研发的 LLaVA-OneVision-2.0，是一款面向下一代感知智能的视觉语言大模型。团队充分利用视频 Codec 流和自研 OneVision-Encoder，实现跨帧、跨事件的增量观测和连续证据流建模。本文将详细介绍模型架构、训练方法与能力验证，展示该技术在视频理解、空间推理和目标追踪等任务中的应用潜力。

来自主题: AI技术研报

6731 点击 2026-06-03 15:03

大晓机器人x南洋理工PhysX-Omni统一物理3D生成！一个框架搞定刚体/软体/关节体

3D生成领域，一个核心矛盾正在浮出水面。

来自主题: AI技术研报

6860 点击 2026-06-03 15:02

一步生成 ImageNet FID 1.29！斯坦福用 Wasserstein 梯度流重写一步生成模型

训练时让分布沿最优传输的 “下山方向” 走，推理时只需一次网络前向。W-Flow 把多步演化压进静态生成器，在 ImageNet 256×256 上刷新一步生成指标。

来自主题: AI技术研报

9797 点击 2026-06-03 14:34

大模型「行口」不一？首个专测执行幻觉基准，覆盖真实行为越狱

随着大模型智能体深入渗透真实操作系统，一种全新的安全威胁悄然成型：行为越狱（Behavior Jailbreak）。现有安全基准只盯着模型「说了什么」，却对「做了什么」视而不见。新基准LITMUS是首个同时覆盖真实OS环境行为越狱、语义-物理双层验证与多攻击范式的完整评测体系，并首次系统量化了「执行幻觉」这一被整个评测社区忽视的致命盲区。

来自主题: AI技术研报

10191 点击 2026-06-03 14:33

ICML 2026 | 计算所联合ETH研究者提出WorldCache，视频世界模型近似无损提速3.7 倍

如果说扩散世界模型的瓶颈，是每一步去噪都要把同一个大 Transformer 再跑一遍，那么 WorldCache 的思路就是：不要再把所有 Token、所有时间步都当成同一件事。这篇工作把 “哪些内容适合缓存”和“哪些时刻必须重算” 拆开处理，在不重新训练模型、几乎不增加额外显存的前提下，把缓存真正做成了一套更贴合世界模型结构的推理策略。

来自主题: AI技术研报

8467 点击 2026-06-03 10:02

浏览器秒变手机！中科院开源Agent训练场，微信、原神都能跑

中科院自动化所模式识别实验室开源MobileGym，运行在浏览器里的高并发安卓仿真平台，完全自定义，告别模拟器风控与真机成本，一个平台搞定Mobile Agent训练与评测，甚至还能玩原神！

来自主题: AI技术研报

6256 点击 2026-06-02 16:17

图灵奖得主Sutton新作：AI的下一步，是走向「生成认知」

从 LLM 的超长文本处理、视频生成模型的以假乱真、Agent 自主规划与执行的日趋成熟，到 VLA、世界模型等开始进入物理世界，AI 正在不断拓宽其能力边界。

来自主题: AI技术研报

6984 点击 2026-06-02 15:05

Mind Lab连续发布LoRA最新进展，大模型「持续学习」新范式浮现

最近，前沿实验室 Mind Lab 密集发布了一系列关于 LoRA 与 PEFT（高效微调）的研究结果，似乎描绘出了另一条大模型「持续学习」的路径。在 Mind Lab 的视角中，PEFT 不再是对大模型全参数后训练的一种廉价平替，更是实现从 “基础模型” 向 “可持续学习智能体” 过渡的核心架构机制。

来自主题: AI技术研报

10103 点击 2026-06-02 12:25

机器人运控训练步入分钟级时代！清华AIR开源UniLab：3分钟训好人形，速度暴涨10倍，Mac上也能跑

在具身智能训练中，“把计算全部塞进GPU”似乎成了唯一的提速密码，机器人运控并行训练的框架，IsaacLab、MuJoCoPlayground、mjlab都默认遵循这一范式，这些系统都牢牢绑定在NVIDIA生态中。

来自主题: AI技术研报

9138 点击 2026-06-02 11:59