
鹅厂开源视频生成大杀器!参考图主体精准复刻,还能编辑现有视频
鹅厂开源视频生成大杀器!参考图主体精准复刻,还能编辑现有视频刚刚,鹅厂开源“自定义”视频生成模型HunyuanCustom。
来自主题: AI技术研报
8179 点击 2025-05-10 17:30
刚刚,鹅厂开源“自定义”视频生成模型HunyuanCustom。
224张GPU,训出开源视频生成新SOTA!Open-Sora 2.0正式发布。 11B参数规模,性能可直追HunyuanVideo和Step-Video(30B)。
刚刚,阶跃星辰联合吉利汽车集团,开源了两款多模态大模型!新模型共2款:全球范围内参数量最大的开源视频生成模型Step-Video-T2V行业内首款产品级开源语音交互大模型Step-Audio多模态卷王开始开源多模态模型,其中Step-Video-T2V采用的还是最为开放宽松的MIT开源协议,可任意编辑和商业应用。
Sora、Genie等模型会都用到的Tokenizer,微软下手了—— 开源了一套全能的Video Tokenizer,名为VidTok。
AI视频生成领域最强搅局者,她来了!影视级效果免费开源,真「赛博菩萨」。
基于 ChatGPT、LLAMA、Vicuna [1, 2, 3] 等大语言模型(Large Language Models,LLMs)的强大理解、生成和推理能力
先上代码再发论文,腾讯新开源文生视频工具火了。名为MuseV,主打基于视觉条件并行去噪的无限长度和高保真虚拟人视频生成。