AI资讯新闻榜单内容搜索-生成模型

SIGGRAPH 2025 | 快手可灵团队提出3D感知的可控电影级视频生成工作CineMaster！

Sora、可灵等视频生成模型令人惊艳的性能表现使得创作者仅依靠文本输入就能够创作出高质量的视频内容。然而，我们常见的电影片段通常是由导演在一个场景中精心布置多个目标的运动、摄像机拍摄角度后再剪辑而成的。例如，在拍摄赛车追逐的场景时，镜头通常跟随赛车运动，并通过扣人心弦的超车时刻来展示赛事的白热化。

来自主题: AI技术研报

11712 点击 2025-05-12 10:31

鹅厂开源视频生成大杀器！参考图主体精准复刻，还能编辑现有视频

刚刚，鹅厂开源“自定义”视频生成模型HunyuanCustom。

来自主题: AI技术研报

10324 点击 2025-05-10 17:30

Harmon：协调视觉表征，统一多模态理解和生成（模型已开源）

GPT-4o 生图功能的出现揭示了统一理解与生成模型的巨大潜力，然而如何在同一个框架内协调图像理解与生成这两种不同粒度的任务，是一个巨大的挑战。

来自主题: AI技术研报

9950 点击 2025-05-10 13:35

ICML 2025 | 视频生成模型无损加速两倍，秘诀竟然是「抓住attention的时空稀疏性」

自 OpenAI 发布 Sora 以来，AI 视频生成技术进入快速爆发阶段。凭借扩散模型强大的生成能力，我们已经可以看到接近现实的视频生成效果。但在模型逼真度不断提升的同时，速度瓶颈却成为横亘在大规模应用道路上的最大障碍。

来自主题: AI技术研报

10554 点击 2025-05-08 10:15

免费！鹅厂最新3D生成模型火爆外网，CG导演都已经用上了

鹅厂最新的3D生成模型，狠狠地圈了一波粉，甚至有人拿它来创作小游戏动画了。

来自主题: AI资讯

12476 点击 2025-05-07 17:56

VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika

随着 Deepseek 等强推理模型的成功，强化学习在大语言模型训练中越来越重要，但在视频生成领域缺少探索。复旦大学等机构将强化学习引入到视频生成领域，经过强化学习优化的视频生成模型，生成效果更加自然流畅，更加合理。并且分别在 VDC（Video Detailed Captioning）[1] 和 VBench [2] 两大国际权威榜单中斩获第一。

来自主题: AI技术研报

11202 点击 2025-05-06 15:07

炸裂！DeepMind 发布 Lyria 2 音乐生成模型！

Google DeepMind正式发布其最新的音乐生成模型Lyria2，标志着音乐创作领域人工智能又一重大突破。该新模型具备高保真音频生成和专业音质，为音乐家、制作人和创作者提供了更强大的工具。

来自主题: AI资讯

10729 点击 2025-04-27 09:16

刚刚，OpenAI图像生成模型API发布，Token计价，一张图花掉1.4元

上个月，OpenAI 在 ChatGPT 中引入了图像生成功能，广受欢迎：仅在第一周，全球就有超过 1.3 亿用户创建了超过 7 亿张图片。就在刚刚，OpenAI 又宣布了一个好消息：他们正式在 API 中推出驱动 ChatGPT 多模态体验的原生模型 ——gpt-image-1，让开发者和企业能够轻松将高质量、专业级的图像生成功能直接集成到自己的工具和平台中。

来自主题: AI资讯

10872 点击 2025-04-24 09:44

清华特奖得主团队视频生成AI一夜刷屏！100%开源+61页技术报告，还能无限扩展生成，网友：游戏规则改变者

新国产AI视频生成模型横空出世，一夜间全网刷屏。Magi-1，首个实现顶级画质输出的自回归视频生成模型，模型权重、代码100%开源。整整61页的技术报告中还详细介绍了创新的注意力改进和推理基础设施设计，给人一种视频版DeepSeek的感觉。

来自主题: AI资讯

11662 点击 2025-04-22 14:54

无限时长/可炼lora打太极，实测AI视频开源模型SkyReels-V2（附5大功能，27个真实案例）

可以生成无限时长的视频生成模型终于来了！

来自主题: AI资讯

11161 点击 2025-04-21 17:08