AI资讯新闻榜单内容搜索-生成模型

刚刚，谢赛宁团队放出第二代表征自编码器 RAEv2

AI 图像生成通常遵循「能力越强、代价越高」的铁律；与此同时，学界却在悄悄质疑另一个更根本的浪费：传统 VAE 对图像语义几乎一无所知，而 DINOv2、SigLIP 等视觉编码器早已从数亿张图片中习得了丰富的视觉常识。图像生成模型，真的需要从零开始「发明」对图像的理解吗？

来自主题: AI技术研报

8432 点击 2026-05-21 16:45

ACL 2026 | 赋予视频生成「视觉思维链」：VChain显式建模时空规划与状态演变

当视频生成模型在视觉保真度上不断突破时，一个核心瓶颈正变得愈发清晰：模型是否真正理解了真实世界？能否推理出合理的演变过程？

来自主题: AI技术研报

9374 点击 2026-05-20 15:16

无需构造偏好对：TGO用标量反馈对齐视觉生成模型｜ICML'26

生成模型的偏好对齐，可能正在进入一个新的阶段。

来自主题: AI技术研报

10196 点击 2026-05-18 09:54

解决视频生成穿帮问题！浙大&微软3000条纯文本让模型理解3D

浙大联合微软亚洲研究院最新提出的World-R1，不改架构、不要3D数据，纯靠强化学习就让视频生成模型学会了“理解”三维世界。World-R1 的出发点很简单：预训练的视频模型里面已经有 3D 知识了，只是“沉睡”着。用强化学习把它叫醒就行。

来自主题: AI技术研报

8602 点击 2026-05-16 13:34

Luma Uni-1.1 API开放，图像模型榜单第三，文字渲染直逼GPT image 2

今年以来，图像生成模型的迭代节奏明显加快。

来自主题: AI技术研报

10052 点击 2026-05-06 15:17

满血版 Seedance 2.0 的成本被 Topview 打下来了！

做过 AI 视频的都懂，除了 Seedance 2.0 本身的高定价，废片所烧掉的 token 算力也是一笔不小的开支。但在 Topview 平台，直接把这笔最大试错成本给重新定义了！热门视频生成模型 Seedance 2.0，加上最新的图片生成模型 Image 2，订阅 Ultra Plan，可不限量使用。

来自主题: AI资讯

8131 点击 2026-04-27 10:00

Z Tech｜师从何恺明，专访 MIT 博士生邓明扬：从 IMO 金牌、IOI 满分的竞赛少年到生成模型研究者

邓明扬现为 MIT 博士生，师从何恺明，主要研究生成模型。本科期间，他在 MIT 学习数学与计算机科学，也曾在 DeepMind 和 Meta 实习。更早之前，他曾获得 IMO 金牌和 IOI 金牌。2026 年，他以第一作者发表了 Drifting Models，尝试探索一种不同于传统路径的生成建模思路。

来自主题: AI资讯

7431 点击 2026-04-21 16:52

训练提速4.6倍！FP4+BF16双轨并行，NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

当强化学习后训练的大规模 rollout 已经被证明能够提升图像生成模型的偏好对齐能力，推理负担就成了制约训练速度的核心瓶颈。来自 NVIDIA、港大和 MIT 的团队提出的 Sol-RL，通过「FP4 先探索、BF16 再训练」的后训练框架，将达到等效 reward 水平的收敛速度最高提升到 4.64x，在训练速度与对齐效果之间给出了一条更具工程可行性的解法。

来自主题: AI技术研报

9104 点击 2026-04-16 16:07

合成数据≠生成模型：一文读懂合成数据的全新范式

最新研究提出合成数据的全新分类框架，突破「生成模型=合成数据」的传统认知，涵盖反演、仿真与数据增强等方法，并按应用层次划分为数据中心AI、模型中心AI、可信AI和具身AI。

来自主题: AI技术研报

6478 点击 2026-04-16 16:06

米哈游蔡浩宇AI公司首个视频模型曝光了

米哈游蔡浩宇的AI公司Anuttacon，首个视频模型正式曝光！Anuttacon技术团队成员@Ailing Zeng，在X上展示了全新视频角色表演生成模型——LPM 1.0。

来自主题: AI资讯

8474 点击 2026-04-11 14:30