
字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍
字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍在生成式模型的迅速发展中,Image Tokenization 扮演着一个很重要的角色,例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间(latent space),使得生成高分辨率图像更有效率。
来自主题: AI技术研报
10530 点击 2024-06-22 23:00