AI资讯新闻榜单内容搜索-视频模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 视频模型
解决视频生成穿帮问题!浙大&微软3000条纯文本让模型理解3D

解决视频生成穿帮问题!浙大&微软3000条纯文本让模型理解3D

解决视频生成穿帮问题!浙大&微软3000条纯文本让模型理解3D

浙大联合微软亚洲研究院最新提出的World-R1,不改架构、不要3D数据,纯靠强化学习就让视频生成模型学会了“理解”三维世界。World-R1 的出发点很简单:预训练的视频模型里面已经有 3D 知识了,只是“沉睡”着。用强化学习把它叫醒就行。

来自主题: AI技术研报
8317 点击    2026-05-16 13:34
谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对

谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对

谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对

今天,谷歌原生视频模型Gemini Omni意外曝光!各种惊艳demo刷爆,教授黑板推导数学公式、一句话编辑视频,丝滑程度让全网破防。

来自主题: AI资讯
6944 点击    2026-05-12 15:21
最新!英伟达Jim Fan预判机器人物理AI将迎大突破:直接抄LLM作业,答案就在视频模型

最新!英伟达Jim Fan预判机器人物理AI将迎大突破:直接抄LLM作业,答案就在视频模型

最新!英伟达Jim Fan预判机器人物理AI将迎大突破:直接抄LLM作业,答案就在视频模型

Jim Fan 在红杉资本 AI Ascent 最新观点,信息量极大,机器人物理AI很快就会迎来突破,答案就在视频模型,路径就是LLM的突破路径,Jim Fan把机器人的未来路线图比作文明游戏里的科技树,还剩三个成就要解锁,2040年就是终局

来自主题: AI资讯
8730 点击    2026-05-09 03:09
打破碎片化瓶颈!浙大&哈佛开源UniGeo,高保真相机可控编辑

打破碎片化瓶颈!浙大&哈佛开源UniGeo,高保真相机可控编辑

打破碎片化瓶颈!浙大&哈佛开源UniGeo,高保真相机可控编辑

UniGeo通过视频模型的连续视角先验与统一几何引导,实现稳定、高质量的相机可控图像生成,全面超越现有方法,在不同幅度的相机运动中提升跨视角一致性与结构稳定性。

来自主题: AI技术研报
6076 点击    2026-05-07 15:04
米哈游蔡浩宇AI公司首个视频模型曝光了

米哈游蔡浩宇AI公司首个视频模型曝光了

米哈游蔡浩宇AI公司首个视频模型曝光了

米哈游蔡浩宇的AI公司Anuttacon,首个视频模型正式曝光!Anuttacon技术团队成员@Ailing Zeng,在X上展示了全新视频角色表演生成模型——LPM 1.0。

来自主题: AI资讯
8336 点击    2026-04-11 14:30
又一国产模型黑马出世,追平Gemini 2.5 Pro,空间编辑反超视频模型?

又一国产模型黑马出世,追平Gemini 2.5 Pro,空间编辑反超视频模型?

又一国产模型黑马出世,追平Gemini 2.5 Pro,空间编辑反超视频模型?

近日,京东开源图像模型JoyAI-Image-Edit,将空间智能纳入图像理解与编辑,让AI开始处理真实世界中的空间关系,让模型真正“理解空间,编辑空间”。简单解释,这是一个以空间智能为核心的图像生成与编辑模型,让 AI 真正“看懂”三维空间,从而让生成更合理、编辑更精准。

来自主题: AI资讯
8834 点击    2026-04-10 21:09
全球首个多模态创意营销 Claw 来了,好创意比以前更值钱了

全球首个多模态创意营销 Claw 来了,好创意比以前更值钱了

全球首个多模态创意营销 Claw 来了,好创意比以前更值钱了

恰好最近,我留意到常用的一个视频生成工具 Vidu,上线了 ViduClaw 「V 龙」——全球首个多模态创意营销 Claw。虽然此前已有不少 AI 厂商推出了自家的「Claw」,但作为视频模型厂商,而且做得这么完整的,Vidu 是我见到的业内头一个。

来自主题: AI资讯
8705 点击    2026-03-28 20:44
生成视频总出物理bug?用VLM迁移+token级对齐,让燃烧在正确位置发生,碰撞遵循动量守恒丨CVPR 2026近满分接收

生成视频总出物理bug?用VLM迁移+token级对齐,让燃烧在正确位置发生,碰撞遵循动量守恒丨CVPR 2026近满分接收

生成视频总出物理bug?用VLM迁移+token级对齐,让燃烧在正确位置发生,碰撞遵循动量守恒丨CVPR 2026近满分接收

当人们谈到“世界模型”(World Models)时,很多人会首先想到近年来迅速发展的生成式视频模型。

来自主题: AI技术研报
8527 点击    2026-03-20 09:39