
一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成
一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成SANA-Sprint是一个高效的蒸馏扩散模型,专为超快速文本到图像生成而设计。通过结合连续时间一致性蒸馏(sCM)和潜空间对抗蒸馏(LADD)的混合蒸馏策略,SANA-Sprint在一步内实现了7.59 FID和0.74 GenEval的最先进性能。SANA-Sprint仅需0.1秒即可在H100上生成高质量的1024x1024图像,在速度和质量的权衡方面树立了新的标杆。
来自主题: AI技术研报
7920 点击 2025-03-31 16:16