只需Image Tokenizer,Llama也能做图像生成了,而且效果超过了扩散模型。
来自主题: AI资讯
8031 点击 2024-07-04 11:09
只需Image Tokenizer,Llama也能做图像生成了,而且效果超过了扩散模型。
超越扩散模型!自回归范式在图像生成领域再次被验证——
众所周知,开发顶级的文生图(T2I)模型需要大量资源,因此资源有限的个人研究者基本都不可能承担得起,这也成为了 AIGC(人工智能内容生成)社区创新的一大阻碍。同时随着时间的推移,AIGC 社区又能获得持续更新的、更高质量的数据集和更先进的算法。
美图影像研究院(MT Lab)与中国科学院大学突破性地提出了基于文生图模型的视频生成新方法 EI2,用于提高视频编辑过程中的语义和内容两方面的一致性。
在 3D 生成领域,根据文本提示创建高质量的 3D 人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。