AI资讯新闻榜单内容搜索-音频模型

Anthropic打响「去CUDA」第一枪！210亿美元豪购谷歌100万块TPU

2026年开局，Anthropic未发一弹已占先机！谷歌首席工程师Jaana Dogan连发多帖，高度赞扬Claude Opus 4.5——没有图像/音频模型、巨大的上下文，仅有一款专注编码的Claude，Anthropic依旧是OpenAI谷歌最有力竞争者。

来自主题: AI资讯

9319 点击 2026-01-04 12:46

A16z 4100万美元领投Mirelo，重磅押注欧洲音频大模型

欧洲音频公司 Mirelo AI 刚刚拿下 4100 万美元种子轮，由 a16z 与 Index Ventures 领投。他们不是再做一个剪辑工具，而是训练自己的音频模型，主打用户给视频，Mirelo 补上所有声音。自动生成音效与配乐，并把它们精确同步到画面上。

来自主题: AI资讯

8922 点击 2025-12-27 14:29

完爆ChatGPT！谷歌这招太狠：连你的「阴阳怪气」都能神还原

谷歌发布Gemini 2.5 Flash原生音频模型，不仅能保留语调进行实时语音翻译，更让AI在复杂指令和连续对话中像真人一样自然流畅。这一更新标志着AI从简单的「文本转语音」跨越到了真正的「拟人化交互」时代。

来自主题: AI资讯

9993 点击 2025-12-15 11:36

Mistral发布首款开源AI音频模型Voxtral

随着 AI 系统越来越强大，人们与机器的交流方式也在发生变化。语音，正在迅速成为默认的交互入口。

来自主题: AI资讯

9006 点击 2025-07-16 16:32

阿里通义开源首个CoT音频模型，音·画同步被狠狠拿捏了

AI音效已经进化成这样了吗？？

来自主题: AI技术研报

8993 点击 2025-07-01 15:56

速递｜Stability AI联手Arm推出最快手机端免云模型，8秒生成11秒音频

AI 初创公司 Stability AI 发布了名为 Stable Audio Open Small 的“立体声”音频生成 AI 模型，该公司宣称这是市场上速度最快的模型，且效率高到足以在智能手机上运行。

来自主题: AI资讯

10053 点击 2025-05-15 14:14

OpenAI深夜发布3个全新的语音模型，一手实测都在这了。

就在刚刚，OpenAI 宣布在其 API 中推出全新一代音频模型，包括语音转文本和文本转语音功能，让开发者能够轻松构建强大的语音 Agent。据 OpenAI 介绍，新推出的 gpt-4o-transcribe 采用多样化、高质量音频数据集进行了长时间的训练，能更好地捕获语音细微差别，减少误识别，大幅提升转录可靠性。

来自主题: AI资讯

11534 点击 2025-03-21 08:27