
当两个「世界第一」同时出现|写在混元与可灵先后宣布登顶全球第一之后
当两个「世界第一」同时出现|写在混元与可灵先后宣布登顶全球第一之后最近,两条消息同时刷屏:先是 9 月 23 日快手宣布其可灵 2.5 Turbo 图生/文生视频模型,推出 10 天后,即在 Artificial Analysis 上成为世界第一;紧接着,腾讯也宣布混元图像 3.0 模型在 LMArena 上成为世界第一。
最近,两条消息同时刷屏:先是 9 月 23 日快手宣布其可灵 2.5 Turbo 图生/文生视频模型,推出 10 天后,即在 Artificial Analysis 上成为世界第一;紧接着,腾讯也宣布混元图像 3.0 模型在 LMArena 上成为世界第一。
看过了这么多款Agent,这一次,AI不仅承包了视频生成,还自带演员进组了。 只需一段简单的提示词,一条充满戏剧张力的微短剧就诞生了。
此次开源的 Wan2.1-VACE-1.3B 支持 480P 分辨率,Wan2.1-VACE-14B 支持 480P 和 720P 分辨率。通过 VACE,用户可一站式完成文生视频、图像参考生成、局部编辑与视频扩展等多种任务,无需频繁切换模型或工具,真正实现高效、灵活的视频创作体验。
做表情包一度是很多文生图、文生视频应用的场景。Pika在去年就靠魔法猫,在国外出圈了一把。
2024年12月30日,长沙中院对全国首例AI文生视频侵权案作出二审维持原判判决,知产库公众号已发布判决书全文。本文对本案的案情和争议焦点简要梳理如下:
进入到 2025 年,视频生成(尤其是基于扩散模型)领域还在不断地「推陈出新」,各种文生视频、图生视频模型展现出了酷炫的效果。其中,长视频生成一直是现有视频扩散的痛点。
2024年12月19日,智源研究院发布并解读国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。
如果从今年10月份开始算,截止到现在,视觉中国股价已经翻了一倍多。有点2022年底GPT概念股的架势。不过,视觉中国的涨停可不是靠概念,而是靠AI项目合作换来的。基于社区、场景和数据优势,目前国内包括智谱、通义千问、可灵AI、即梦AI、生数科技(Vidu)、爱诗科技(Pixverse)等几乎所有主流文生视频平台都接入了视觉中国。
这两天,北京大学等研究团队发布了一个视频生成的可控生成工作:ConsisID。ConsisID可以实现无需训练Lora的保持参考人脸一致性的文生视频,类似之前图像生成的IP-Adapter-Face和InstantID等工作。虽然之前也有类似的工作,但是ConsisID在效果更上一个台阶。
想要体验文生视频的小伙伴又多了一个选择!