AI资讯新闻榜单内容搜索-文生图模型

沿着何恺明团队「漂移模型」再走一步：奖励只需排名，单步文生图偏好优化提速3.51倍

来自西湖大学和香港中文大学（深圳）的团队沿着这一思路提出 Drifting Preference Optimization（DrPO），把漂移场用于单步文生图模型的偏好后训练。在 DrPO 中，奖励只负责对候选图像排序，不参与反向传播。具体而言，针对同一个文本提示词，当前模型生成一组候选图像。高分样本在特征空间中产生吸引，低分样本产生排斥，并结合参考模型约束给出模型的更新方向。

来自主题: AI技术研报

7367 点击 2026-06-21 10:33

ICML 2026｜文生图模型也会「忘词」？复旦创智等提出Prompt Reinjection，无需训练提升文生图指令遵循能力

近年来，文生图模型的能力快速提升。从 Stable Diffusion 到 FLUX、Qwen-Image，扩散模型已经能够生成高质量图像，也能处理越来越复杂的文本提示。

来自主题: AI技术研报

9371 点击 2026-06-09 10:02

阿里开源PromptEcho：用冻结多模态大模型为文生图训练提供高质量Reward

用强化学习（RL）优化文生图模型的 prompt following 能力，是一条被广泛验证的路径 —— 让模型根据 prompt 用不同随机种子生成多张图片，通过 reward model 计算 reward，再利用相关 RL 算法优化模型。

来自主题: AI技术研报

7309 点击 2026-05-06 14:27

LeCun、谢赛宁团队重磅论文：RAE能大规模文生图了，且比VAE更好

编辑｜Panda 在文生图模型的技术版图中，VAE 几乎已经成为共识。从 Stable Diffusion 到 FLUX，再到一系列扩散 Transformer，主流路线高度一致：先用 VAE 压缩视

来自主题: AI技术研报

7859 点击 2026-01-24 10:52

6B文生图模型，上线即登顶抱抱脸

6B小模型，首日下载量高达50万次，上线不到两天直接把HuggingFace两个榜单都冲了个第一。

来自主题: AI技术研报

7831 点击 2025-12-01 15:13

Nano Banana Pro上线！集成Gemini 3与Veo 3，谷歌不给竞争对手喘息机会

谷歌乘胜追击！Gemini 3 Pro好评如潮没两天，最强文生图模型Nano Banana也推出Pro版本。

来自主题: AI资讯

8612 点击 2025-11-21 10:54

Nano-Banana 核心团队首次揭秘，全球最火的 AI 生图工具是怎么打造的

在图像生成上，Google 其实已经有 Imagen 4 这样的文生图模型，为什么 nano banana 最后还是由 Google 带来的？但这确实不是偶然或者瞎猜的，nano banana 是结合了 Google 多个团队的项目成果。首先就是 Gemini 强大的世界知识与指令遵循能力，其次就是 Google 内部顶尖文生图模型 Imagen，所提供的极致图像美学与自然度追求。

来自主题: AI技术研报

11845 点击 2025-09-02 09:24