英伟达开源福利:视频生成、机器人都能用的SOTA tokenizer
英伟达开源福利:视频生成、机器人都能用的SOTA tokenizertokenizer对于图像、视频生成的重要性值得重视。
来自主题: AI技术研报
4072 点击 2024-11-23 16:31
tokenizer对于图像、视频生成的重要性值得重视。
只需Image Tokenizer,Llama也能做图像生成了,而且效果超过了扩散模型。
在生成式模型的迅速发展中,Image Tokenization 扮演着一个很重要的角色,例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间(latent space),使得生成高分辨率图像更有效率。
技术大神卡帕西离职OpenAI以后,营业可谓相当积极啊。