Meta AI推出FoleyGen,用视频生成音频
Meta AI推出FoleyGen,用视频生成音频FoleyGen利用现成的神经音频编解码器在波形和离散标记之间进行双向转换。音频标记的生成由单个变换器模型完成,该模型以从视觉编码器中提取的视觉特征为条件。
来自主题: AI技术研报
6277 点击 2023-09-21 09:42
FoleyGen利用现成的神经音频编解码器在波形和离散标记之间进行双向转换。音频标记的生成由单个变换器模型完成,该模型以从视觉编码器中提取的视觉特征为条件。