AI资讯新闻榜单内容搜索-视频生成模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 视频生成模型
快手可灵提出VLM-as-Teacher:用测试时在线优化,让视频生成模型学会按规则推理

快手可灵提出VLM-as-Teacher:用测试时在线优化,让视频生成模型学会按规则推理

快手可灵提出VLM-as-Teacher:用测试时在线优化,让视频生成模型学会按规则推理

怎么让VGM学会按规则推理?过去主要有两条路。两条路,一个不动模型,一个只写文字,都没真正解决“执行”问题。为此,城大×快手可灵提出了第三条路:VLM-as-Teacher。

来自主题: AI技术研报
7533 点击    2026-06-06 09:51
京东开源音视频生成框架JoyAI-Echo,5分钟叙事角色不崩,声音不乱,秒出片

京东开源音视频生成框架JoyAI-Echo,5分钟叙事角色不崩,声音不乱,秒出片

京东开源音视频生成框架JoyAI-Echo,5分钟叙事角色不崩,声音不乱,秒出片

京东首次开源长音视频生成框架JoyAI-Echo。它直击长视频生成中的角色一致性、声音稳定性和生成速度三大核心难题,一举在多个核心指标上超越行业标杆模型。根据公开评测结果,JoyAI-Echo在跨镜头一致性、语音准确率、用户偏好等关键指标上均取得领先表现,与业内主流长视频生成模型相比优势明显,出道即跻身全球第一梯队。

来自主题: AI资讯
8265 点击    2026-06-05 22:06
图灵奖得主Sutton新作:AI的下一步,是走向「生成认知」

图灵奖得主Sutton新作:AI的下一步,是走向「生成认知」

图灵奖得主Sutton新作:AI的下一步,是走向「生成认知」

从 LLM 的超长文本处理、视频生成模型的以假乱真、Agent 自主规划与执行的日趋成熟,到 VLA、世界模型等开始进入物理世界,AI 正在不断拓宽其能力边界。

来自主题: AI技术研报
6401 点击    2026-06-02 15:05
小云雀短剧Agent升级2.0,我花200元就做了一部AI版的《给阿嬷的情书》

小云雀短剧Agent升级2.0,我花200元就做了一部AI版的《给阿嬷的情书》

小云雀短剧Agent升级2.0,我花200元就做了一部AI版的《给阿嬷的情书》

近日,字节旗下AI视频创作工具小云雀的短剧Agent正式更新到2.0版本。自Seedance 2.0这一视频生成模型横空出世以来,小云雀一直是其原生支持的平台。由于整体使用门槛相对较低,小云雀也逐渐积累起一批AI短剧和AI短片创作者。

来自主题: AI资讯
9128 点击    2026-05-29 15:28
高分辨率视频生成不再慢半拍:让大模型保留“原味”的同时提速十余倍

高分辨率视频生成不再慢半拍:让大模型保留“原味”的同时提速十余倍

高分辨率视频生成不再慢半拍:让大模型保留“原味”的同时提速十余倍

当下视频生成模型正在快速逼近真实世界的画面质感,但一个现实瓶颈也越来越突出—— 那就是分辨率越高,生成所需要的时间就越长。

来自主题: AI技术研报
7954 点击    2026-05-28 14:50
久不发声的美团AI,一开口就开源商用数字人——还把三个闭源大佬给超了

久不发声的美团AI,一开口就开源商用数字人——还把三个闭源大佬给超了

久不发声的美团AI,一开口就开源商用数字人——还把三个闭源大佬给超了

就在今天,美团龙猫大模型团队突然开源了商用级数字人视频生成模型 LongCat-Video-Avatar 1.5。在权威评测中,它的用户偏好胜率全面超越 Kling Avatar 2.0、OmniHuman-1.5 和 HeyGen 这三个头部玩家,并且直接以 MIT 协议开放,连商用限制都懒得设。

来自主题: AI资讯
9321 点击    2026-05-22 21:38
ACL 2026 | 赋予视频生成「视觉思维链」:VChain显式建模时空规划与状态演变

ACL 2026 | 赋予视频生成「视觉思维链」:VChain显式建模时空规划与状态演变

ACL 2026 | 赋予视频生成「视觉思维链」:VChain显式建模时空规划与状态演变

当视频生成模型在视觉保真度上不断突破时,一个核心瓶颈正变得愈发清晰:模型是否真正理解了真实世界?能否推理出合理的演变过程?

来自主题: AI技术研报
9349 点击    2026-05-20 15:16
解决视频生成穿帮问题!浙大&微软3000条纯文本让模型理解3D

解决视频生成穿帮问题!浙大&微软3000条纯文本让模型理解3D

解决视频生成穿帮问题!浙大&微软3000条纯文本让模型理解3D

浙大联合微软亚洲研究院最新提出的World-R1,不改架构、不要3D数据,纯靠强化学习就让视频生成模型学会了“理解”三维世界。World-R1 的出发点很简单:预训练的视频模型里面已经有 3D 知识了,只是“沉睡”着。用强化学习把它叫醒就行。

来自主题: AI技术研报
8583 点击    2026-05-16 13:34
满血版 Seedance 2.0 的成本被 Topview 打下来了!

满血版 Seedance 2.0 的成本被 Topview 打下来了!

满血版 Seedance 2.0 的成本被 Topview 打下来了!

做过 AI 视频的都懂,除了 Seedance 2.0 本身的高定价,废片所烧掉的 token 算力也是一笔不小的开支。但在 Topview 平台,直接把这笔最大试错成本给重新定义了!热门视频生成模型 Seedance 2.0,加上最新的图片生成模型 Image 2,订阅 Ultra Plan,可不限量使用。

来自主题: AI资讯
8108 点击    2026-04-27 10:00