AI资讯新闻榜单内容搜索-不

多模态模型终于不用「抽帧看世界」？LLaVA-OneVision-2.0全开源全帧率技术解读

由格灵深瞳灵感实验室主导研发的 LLaVA-OneVision-2.0，是一款面向下一代感知智能的视觉语言大模型。团队充分利用视频 Codec 流和自研 OneVision-Encoder，实现跨帧、跨事件的增量观测和连续证据流建模。本文将详细介绍模型架构、训练方法与能力验证，展示该技术在视频理解、空间推理和目标追踪等任务中的应用潜力。

来自主题: AI技术研报

6698 点击 2026-06-03 15:03

大模型「行口」不一？首个专测执行幻觉基准，覆盖真实行为越狱

随着大模型智能体深入渗透真实操作系统，一种全新的安全威胁悄然成型：行为越狱（Behavior Jailbreak）。现有安全基准只盯着模型「说了什么」，却对「做了什么」视而不见。新基准LITMUS是首个同时覆盖真实OS环境行为越狱、语义-物理双层验证与多攻击范式的完整评测体系，并首次系统量化了「执行幻觉」这一被整个评测社区忽视的致命盲区。

来自主题: AI技术研报

10169 点击 2026-06-03 14:33

国内GPU卡全线飙涨原因分析

5 月份，非常非常多的人寄希望于两个大佬谈判之后的的 GPU管制放松，特别是上一代 hopper架构的顶配算力卡松绑，弥补内部的算力不足，但是结果事与愿违，双方在 GPU 算力领域抓紧了卡脖子竞赛，彼此相互掐。（不要抱幻想了，干就完了）

来自主题: AI资讯

9910 点击 2026-06-03 14:31

全球顶尖法律AI每月处理12万亿token，为什么不用OpenAI的云？

Harvey 是全球最大的法律 AI 公司，客户是世界顶尖律所和企业法务团队。你可能没怎么听说过它，但在法律行业，它基本上是那个大家已经在用、不需要再讨论的选择——就像律师界的 Salesforce，你不会问"要不要用"，只问"怎么接进来"。

来自主题: AI资讯

7069 点击 2026-06-03 14:31

Liquid AI：端侧 AI 独角兽的美国往事

Liquid AI 近期推出的 LocalCowork，正是直面这一矛盾的产物：单台笔记本，无需云端 API，数据绝不离机。凭借 67 个本地工具、13 个 MCP Servers，配合最新发布的 LFM2.5-8B-A1B 模型，它通过本地调用工具、解释结果以及可审计的工作流，解决了上述难题。

来自主题: AI资讯

9567 点击 2026-06-03 10:11

ICML 2026 | 计算所联合ETH研究者提出WorldCache，视频世界模型近似无损提速3.7 倍

如果说扩散世界模型的瓶颈，是每一步去噪都要把同一个大 Transformer 再跑一遍，那么 WorldCache 的思路就是：不要再把所有 Token、所有时间步都当成同一件事。这篇工作把 “哪些内容适合缓存”和“哪些时刻必须重算” 拆开处理，在不重新训练模型、几乎不增加额外显存的前提下，把缓存真正做成了一套更贴合世界模型结构的推理策略。

来自主题: AI技术研报

8352 点击 2026-06-03 10:02