AI资讯新闻榜单内容搜索-Vide

这年头学不会数理化，只能怪自己懒，谷歌NotebookLM上新，秒出科普视频

最近，谷歌 NotebookLM 又出了个好玩好用的小功能：Cinematic Video Overviews（电影级视频概览）。与普通模板不同，这项功能可以根据我们上传的资料，自动生成定制化、沉浸式的视频讲解。

来自主题: AI资讯

7490 点击 2026-03-15 08:48

劝视频博主别拿龙虾起号，7×24小时全自动，碳基生物真卷不过

起猛了，现在龙虾也能做视频了？？？

来自主题: AI资讯

8580 点击 2026-03-12 14:13

10秒视频token超5万，O(n²)跑不动？用后训练线性化框架实现1.71倍加速，推理成本大降｜CVPR'2026

视频生成进入大规模时代，但计算成本也炸了。

来自主题: AI技术研报

6066 点击 2026-03-10 14:32

CVPR 2026 | AI寒武纪时刻？字节世界模型新作，仅靠视觉学习真实世界知识

视觉世界模型 “VideoWorld 2” 由豆包大模型团队与北京交通大学联合提出。不同于 Sora 2 、Veo 3、Wan 2.2 等主流多模态模型，VideoWorld 系列工作在业界首次实现无需依赖语言模型，即可认知世界。

来自主题: AI技术研报

5613 点击 2026-03-09 14:29

为什么顶尖投行都选择了 Rogo 这个金融 Agent？

全球投行业每年处理超过 3.5 万亿美元的交易，但驱动这台庞大机器运转的，是数以万计每周工作超过百小时、从事着高度重复性劳动的初级分析师。Vertical Agent 开始加速很多专业领域的工作流，比如法律领域的 Harvey、医疗领域的 OpenEvidence，而在离钱最近的金融领域迟迟未能出现一款真正的统治级应用。

来自主题: AI资讯

6727 点击 2026-03-06 10:10

ICLR 2026｜滑铁卢大学联合可灵提出UniVideo：统一视频理解、生成、编辑多模态

统一多模态模型在多模态内容理解与生成方面已展现出良好效果，但目前仍主要局限于图像领域。

来自主题: AI技术研报

6974 点击 2026-03-06 09:31

46.5万次盲测封王！Grok视频模型屠榜Arena，谷歌最强对手来了

xAI的Grok图像转视频模型（grok-image-video-720p）登顶「Image-to-Video Arena」排行榜，以1404分的超高ELO评分力压群雄，位居第一。马斯克亲自发帖为自家Grok Image模型站台，称它每周都在迭代优化。

来自主题: AI资讯

10461 点击 2026-02-25 15:07

ICLR 2026 | 异常需要定义！中传团队提出开放世界视频异常检测新范式

针对这一问题，中国传媒大学媒体融合与传播国家重点实验室的吴晓雨教授团队于 ICLR 2026 发表论文《Language-guided Open-world Video Anomaly Detection under Weak Supervision》，直面 VAD 领域的核心问题 —— 什么是异常？

来自主题: AI技术研报

8169 点击 2026-02-14 10:03

全新视角看世界模型：从视频生成迈向通用世界模拟器

近年来，视频生成（Video Generation）与世界模型（World Models）已跃升为人工智能领域最炙手可热的焦点。从 Sora 到可灵（Kling），视频生成模型在运动连续性、物体交互与部分物理先验上逐渐表现出更强的「世界一致性」，让人们开始认真讨论：能否把视频生成从「逼真短片」推进到可用于推理、规划与控制的「通用世界模拟器」。

来自主题: AI技术研报

9551 点击 2026-02-09 14:36

Vibe Researching必备的科研MCP和Skills，实现10倍学术产出

大家好，我是鲁工。 Vibe Coding概念火了之后，顺带在很多领域兴起了Vibe的潮流。比如Vibe PPT、Vibe Video，以及我今天要聊的Vibe Researching。

来自主题: AI技术研报

9175 点击 2026-02-02 10:03