
腾讯混元最新开源:一键生成电影级音效,性能表现全面SOTA
腾讯混元最新开源:一键生成电影级音效,性能表现全面SOTA自带声音的视频生成模型,开源版开卷! 最新赶到的是腾讯混元:刚刚正式开源端到端的视频音效生成模型HunyuanVideo-Foley。
自带声音的视频生成模型,开源版开卷! 最新赶到的是腾讯混元:刚刚正式开源端到端的视频音效生成模型HunyuanVideo-Foley。
打工人超超超实用利器来了!还在自己苦巴巴地做汇报,干巴巴地念PPT么? 谷歌NotebookLM最新功能,只需要输入数据、图表、旁白,就可以自动生成带AI音频的PPT,甚至不需要自己去讲。
据知情人士透露,Meta Platforms 已收购专注于人工智能情感识别与音频模拟的小型初创公司 WaveForms AI。
华强北推出低价AI眼镜,价格78-450元,截胡小米、Rokid等巨头产品。产品分为AI拍摄眼镜和AI音频眼镜,功能基础但销量火爆,月均数千台。厂商快速组装出货,靠价格优势和即买即得吸引消费者尝鲜,性能虽逊但性价比高。行业前景存疑,技术成熟需5年,海外市场更受欢迎。
随着 AI 系统越来越强大,人们与机器的交流方式也在发生变化。语音,正在迅速成为默认的交互入口。
AI不是万能解药 作为中国最大的在线音频平台,喜马拉雅又传出要 “ 卖身 ” 的消息了,据传腾讯音乐打算通过现金+股票的方式收购喜马拉雅。
首个专为ALLMs(音频大语言模型)设计的多维度可信度评估基准来了。
超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。
AI 初创公司 Stability AI 发布了名为 Stable Audio Open Small 的“立体声”音频生成 AI 模型,该公司宣称这是市场上速度最快的模型,且效率高到足以在智能手机上运行。
空间音频,作为一种能够模拟真实听觉环境的技术,正逐渐成为提升沉浸式体验的关键。