音频市场进入AI时代,开放式耳机终于迎来爆发期?
音频市场进入AI时代,开放式耳机终于迎来爆发期?AI 交互会是开放式耳机的下一个爆点。
来自主题: AI资讯
8331 点击 2024-05-30 10:50
AI 交互会是开放式耳机的下一个爆点。
ElevenLabs宣布B轮8000万刀融资,估值超过10亿美元,跻身独角兽行列。
在文本生成音频(或音乐)这个 AIGC 赛道,Meta 最近又有了新研究成果,而且开源了。前几日,在论文《Masked Audio Generation using a Single Non-Autoregressive Transformer》中,Meta FAIR 团队、Kyutai 和希伯来大学推出了 MAGNeT,一种在掩码生成序列建模方法。
最近,来自Meta和UC伯克利的研究人员,发布了一种最新的音频到人像模型。操作简单,输出极致逼真。
FoleyGen利用现成的神经音频编解码器在波形和离散标记之间进行双向转换。音频标记的生成由单个变换器模型完成,该模型以从视觉编码器中提取的视觉特征为条件。