
ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型
ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型三维数字人生成和编辑在数字孪生、元宇宙、游戏、全息通讯等领域有广泛应用。传统三维数字人制作往往费时耗力,近年来研究者提出基于三维生成对抗网络(3D GAN)从 2D 图像中学习三维数字人,极大提高了数字人制作效率。
三维数字人生成和编辑在数字孪生、元宇宙、游戏、全息通讯等领域有广泛应用。传统三维数字人制作往往费时耗力,近年来研究者提出基于三维生成对抗网络(3D GAN)从 2D 图像中学习三维数字人,极大提高了数字人制作效率。
只需30秒,AI就能像3D建模师一样,在各种指示下生成高质量人造Mesh。
只用1890美元、3700 万张图像,就能训练一个还不错的扩散模型。
用扩散模型搞社交信息推荐,怎么解决数据噪声难题?现有的一些自监督学习方法效果还是有限。
近日,MIT CSAIL 的一个研究团队(一作为 MIT 在读博士陈博远)成功地将全序列扩散模型与下一 token 模型的强大能力统合到了一起,提出了一种训练和采样范式:Diffusion Forcing(DF)。
想象一下你在刷短视频,系统想要推荐你可能会喜欢的内容。
只需Image Tokenizer,Llama也能做图像生成了,而且效果超过了扩散模型。
事实证明,扩散模型不仅能用于生成图像和视频,也能用于合成新程序。
超越扩散模型!自回归范式在图像生成领域再次被验证——
3D场景理解让人形机器人「看得见」周身场景,使汽车自动驾驶功能能够实时感知行驶过程中可能出现的情形,从而做出更加智能化的行为和反应。而这一切需要大量3D场景的详细标注,从而急剧提升时间成本和资源投入。