AI资讯新闻榜单内容搜索-可灵

仅保留35% Token，性能反超原模型！快手可灵等用视觉信息引导音频压缩，推理时间直降42%

一段几十秒的音视频，上万Token，一半以上是冗余——Omni-LLM的计算浪费，比想象中更严重。

来自主题: AI技术研报

8442 点击 2026-03-11 15:06

CVPR 2026 | 1B模型也能当多镜头导演？大连理工&快手可灵开源力作MultiShotMaster

近期，大连理工与快手可灵团队推出了 MultiShotMaster—— 一个高度可控的多镜头视频生成框架，该论文向研究社区展示了即使在 1B 左右的小参数量级模型上，也可以实现导演级的镜头调度和连贯叙事，且支持多图参考、主体运动控制。

来自主题: AI技术研报

8870 点击 2026-03-06 15:06

ICLR 2026｜滑铁卢大学联合可灵提出UniVideo：统一视频理解、生成、编辑多模态

统一多模态模型在多模态内容理解与生成方面已展现出良好效果，但目前仍主要局限于图像领域。

来自主题: AI技术研报

7349 点击 2026-03-06 09:31

来一手Qwen-Image-2.0实测，好像还不错？！

BUBBLE 2026 — ISSUE #18 家人们，马上没几天快过年了，明显各个厂商已经开始疯狂卷了。上周到现在，让我们来算算有多少东西了， 5.3 Codex，4.6 Opus，可灵3.0

来自主题: AI产品测评

10707 点击 2026-02-11 12:43

全新视角看世界模型：从视频生成迈向通用世界模拟器

近年来，视频生成（Video Generation）与世界模型（World Models）已跃升为人工智能领域最炙手可热的焦点。从 Sora 到可灵（Kling），视频生成模型在运动连续性、物体交互与部分物理先验上逐渐表现出更强的「世界一致性」，让人们开始认真讨论：能否把视频生成从「逼真短片」推进到可用于推理、规划与控制的「通用世界模拟器」。

来自主题: AI技术研报

9837 点击 2026-02-09 14:36