
文生图进入R1时代:港中文MMLab发布T2I-R1,让AI绘画“先推理再下笔”
文生图进入R1时代:港中文MMLab发布T2I-R1,让AI绘画“先推理再下笔”“先推理、再作答”,语言大模型的Thinking模式,现在已经被拓展到了图片领域。
来自主题: AI技术研报
6563 点击 2025-05-13 15:02
“先推理、再作答”,语言大模型的Thinking模式,现在已经被拓展到了图片领域。
香港中文大学(深圳)数据科学学院武执政副教授团队联合上海人工智能实验室 OpenMMLab 团队开源了综合音频生成项目 Amphion(安菲翁)。该系统旨在打造一个集语音合成转换、歌声合成转换、音效音乐生成等多功能为一体的开源平台。