AI音频“扛把子”刚上谷歌V2A,第一个视频+音频全自动AI工具,完全开源免费
AI音频“扛把子”刚上谷歌V2A,第一个视频+音频全自动AI工具,完全开源免费最强AI音频工具来了!
来自主题: AI资讯
9095 点击 2024-06-20 22:18
最强AI音频工具来了!
AI 交互会是开放式耳机的下一个爆点。
ElevenLabs宣布B轮8000万刀融资,估值超过10亿美元,跻身独角兽行列。
在文本生成音频(或音乐)这个 AIGC 赛道,Meta 最近又有了新研究成果,而且开源了。前几日,在论文《Masked Audio Generation using a Single Non-Autoregressive Transformer》中,Meta FAIR 团队、Kyutai 和希伯来大学推出了 MAGNeT,一种在掩码生成序列建模方法。
最近,来自Meta和UC伯克利的研究人员,发布了一种最新的音频到人像模型。操作简单,输出极致逼真。
FoleyGen利用现成的神经音频编解码器在波形和离散标记之间进行双向转换。音频标记的生成由单个变换器模型完成,该模型以从视觉编码器中提取的视觉特征为条件。