AI资讯新闻榜单内容搜索-生成模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 生成模型

VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika

VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika

VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika

随着 Deepseek 等强推理模型的成功，强化学习在大语言模型训练中越来越重要，但在视频生成领域缺少探索。复旦大学等机构将强化学习引入到视频生成领域，经过强化学习优化的视频生成模型，生成效果更加自然流畅，更加合理。并且分别在 VDC（Video Detailed Captioning）[1] 和 VBench [2] 两大国际权威榜单中斩获第一。

来自主题: AI技术研报

9169 点击 2025-05-06 15:07

炸裂！DeepMind 发布 Lyria 2 音乐生成模型！

炸裂！DeepMind 发布 Lyria 2 音乐生成模型！

炸裂！DeepMind 发布 Lyria 2 音乐生成模型！

Google DeepMind正式发布其最新的音乐生成模型Lyria2，标志着音乐创作领域人工智能又一重大突破。该新模型具备高保真音频生成和专业音质，为音乐家、制作人和创作者提供了更强大的工具。

来自主题: AI资讯

8944 点击 2025-04-27 09:16

刚刚，OpenAI图像生成模型API发布，Token计价，一张图花掉1.4元

刚刚，OpenAI图像生成模型API发布，Token计价，一张图花掉1.4元

刚刚，OpenAI图像生成模型API发布，Token计价，一张图花掉1.4元

上个月，OpenAI 在 ChatGPT 中引入了图像生成功能，广受欢迎：仅在第一周，全球就有超过 1.3 亿用户创建了超过 7 亿张图片。就在刚刚，OpenAI 又宣布了一个好消息：他们正式在 API 中推出驱动 ChatGPT 多模态体验的原生模型 ——gpt-image-1，让开发者和企业能够轻松将高质量、专业级的图像生成功能直接集成到自己的工具和平台中。

来自主题: AI资讯

8610 点击 2025-04-24 09:44

清华特奖得主团队视频生成AI一夜刷屏！100%开源+61页技术报告，还能无限扩展生成，网友：游戏规则改变者

清华特奖得主团队视频生成AI一夜刷屏！100%开源+61页技术报告，还能无限扩展生成，网友：游戏规则改变者

清华特奖得主团队视频生成AI一夜刷屏！100%开源+61页技术报告，还能无限扩展生成，网友：游戏规则改变者

新国产AI视频生成模型横空出世，一夜间全网刷屏。Magi-1，首个实现顶级画质输出的自回归视频生成模型，模型权重、代码100%开源。整整61页的技术报告中还详细介绍了创新的注意力改进和推理基础设施设计，给人一种视频版DeepSeek的感觉。

来自主题: AI资讯

9825 点击 2025-04-22 14:54

无限时长/可炼lora打太极，实测AI视频开源模型SkyReels-V2（附5大功能，27个真实案例）

无限时长/可炼lora打太极，实测AI视频开源模型SkyReels-V2（附5大功能，27个真实案例）

无限时长/可炼lora打太极，实测AI视频开源模型SkyReels-V2（附5大功能，27个真实案例）

可以生成无限时长的视频生成模型终于来了！

来自主题: AI资讯

8754 点击 2025-04-21 17:08

纯自回归图像生成模型开源来了，复旦联手字节seed共同捍卫自回归

纯自回归图像生成模型开源来了，复旦联手字节seed共同捍卫自回归

纯自回归图像生成模型开源来了，复旦联手字节seed共同捍卫自回归

基于Transformer的自回归架构在语言建模上取得了显著成功，但在图像生成领域，扩散模型凭借强大的生成质量和可控性占据了主导地位。

来自主题: AI技术研报

8050 点击 2025-04-19 15:01

最强视觉生成模型获马斯克连夜关注，吉卜力风格转绘不再需要GPT了

最强视觉生成模型获马斯克连夜关注，吉卜力风格转绘不再需要GPT了

最强视觉生成模型获马斯克连夜关注，吉卜力风格转绘不再需要GPT了

“史上最强视觉生成模型”，现在属于快手。一基双子的可灵AI基础模型——文/图生图的可图、文/图生视频的可灵，都重磅升级到2.0版本。可图2.0，对比MidJourney 7.0，胜负比「(good+same) / (same+bad)」超300%，对比FLUX超过150%；

来自主题: AI资讯

8913 点击 2025-04-17 20:46

字节最新人像视频生成模型DreamActor-M1，推特关注超百万！即梦AI即将上线

字节最新人像视频生成模型DreamActor-M1，推特关注超百万！即梦AI即将上线

字节最新人像视频生成模型DreamActor-M1，推特关注超百万！即梦AI即将上线

自数字人技术Omnihuman-1引起行业关注之后，字节智能创作团队再放大招。全新DreamActor-M1横空出世，一张照片一段视频，就能生成电影级视频，精准迁移表情动作，还支持多种画风。

来自主题: AI技术研报

10231 点击 2025-04-10 11:12

南洋理工&普渡大学提出CFG-Zero*：在Flow Matching模型中实现更稳健的无分类器引导方法

南洋理工&普渡大学提出CFG-Zero*：在Flow Matching模型中实现更稳健的无分类器引导方法

南洋理工&普渡大学提出CFG-Zero*：在Flow Matching模型中实现更稳健的无分类器引导方法

本篇论文是由南洋理工大学 S-Lab 与普渡大学提出的无分类引导新范式，支持所有 Flow Matching 的生成模型。目前已被集成至 Diffusers 与 ComfyUI。

来自主题: AI技术研报

8914 点击 2025-04-09 15:40

7B扩散LLM，居然能跟671B的DeepSeek V3掰手腕，扩散vs自回归，谁才是未来？

7B扩散LLM，居然能跟671B的DeepSeek V3掰手腕，扩散vs自回归，谁才是未来？

7B扩散LLM，居然能跟671B的DeepSeek V3掰手腕，扩散vs自回归，谁才是未来？

语言是离散的，所以适合用自回归模型来生成；而图像是连续的，所以适合用扩散模型来生成。在生成模型发展早期，这种刻板印象广泛存在于很多研究者的脑海中。

来自主题: AI技术研报

6588 点击 2025-04-06 16:48

上一页当前第7页,共21页下一页