AI资讯新闻榜单内容搜索-语音大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 语音大模型
独家|上交投资的首家语音大模型宇生月伴完成数千万元融资,加速走向全球,技术指标全面超越11Labs

独家|上交投资的首家语音大模型宇生月伴完成数千万元融资,加速走向全球,技术指标全面超越11Labs

独家|上交投资的首家语音大模型宇生月伴完成数千万元融资,加速走向全球,技术指标全面超越11Labs

情感语音交互模型初创公司宇生月伴近日完成新一轮融资,由靖亚资本和小苗朗程领投,菡源资产(上海交大母基金)跟投,心流资本FlowCapital担任长期财务顾问。本轮融资将用于语音模型的持续优化、产品矩阵拓展及国际化商业落地。作为国内首家聚焦“情感语音交互”的模型公司,宇生月伴正重新定义AI时代的语音交互范式。

来自主题: AI资讯
7397 点击    2025-08-19 22:13
完全透明开源的共情语音大模型,三阶段训练,四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S

完全透明开源的共情语音大模型,三阶段训练,四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S

完全透明开源的共情语音大模型,三阶段训练,四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S

GPT-4o、Gemini这些顶级语音模型虽然展现了惊人的共情对话能力,但它们的技术体系完全闭源。

来自主题: AI技术研报
7289 点击    2025-07-16 16:30
首个全面梳理语音大模型发展脉络的权威综述,入选ACL 2025主会

首个全面梳理语音大模型发展脉络的权威综述,入选ACL 2025主会

首个全面梳理语音大模型发展脉络的权威综述,入选ACL 2025主会

由香港中文大学团队撰写的语音语言模型综述论文《Recent Advances in Speech Language Models: A Survey》已成功被 ACL 2025 主会议接收!这是该领域首个全面系统的综述,为语音 AI 的未来发展指明了方向。

来自主题: AI技术研报
6634 点击    2025-06-17 16:45
国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类

国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类

国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类

近期,港中大(深圳)联手趣丸科技联合推出了新一代大规模声音克隆 TTS 模型 ——MaskGCT。该模型在包含 10 万小时多语言数据的 Emilia 数据集上进行训练,展现出超自然的语音克隆、风格迁移以及跨语言生成能力,同时保持了较强的稳定性。MaskGCT 已在香港中文大学(深圳)与上海人工智能实验室联合开发的开源系统 Amphion 发布。

来自主题: AI技术研报
3526 点击    2024-10-30 13:57
最难方言温州话被攻克!中国电信语音大模型支持30种方言,这题GPT-4o可不会做啊

最难方言温州话被攻克!中国电信语音大模型支持30种方言,这题GPT-4o可不会做啊

最难方言温州话被攻克!中国电信语音大模型支持30种方言,这题GPT-4o可不会做啊

更适配中文的语音大模型来了—— 来自中国电信人工智能研究院,AI领域Fellow大满贯科学家李学龙带队,发布首个能听懂30多种多方言混说的大模型。 号称最难方言、“魔鬼的语言”的温州话,也不在话下。

来自主题: AI资讯
10094 点击    2024-05-28 20:12
换了30多种方言,我们竟然没能考倒中国电信的语音大模型

换了30多种方言,我们竟然没能考倒中国电信的语音大模型

换了30多种方言,我们竟然没能考倒中国电信的语音大模型

不管你来自哪个城市,相信在你的记忆中,都有自己的「家乡话」:吴语柔软细腻、关中方言质朴厚重、四川方言幽默诙谐、粤语古雅潇洒…… 某种意义上说,方言不只是一种语言习惯,也是一种情感连接、一种文化认同。我们「上网冲浪」遇到的新鲜词汇中,有不少就是来自各地方言。当然,有些时候,方言也是一种交流「壁垒」。

来自主题: AI资讯
7664 点击    2024-05-27 16:10
国产算力和国产大模型,迎来双赢时刻

国产算力和国产大模型,迎来双赢时刻

国产算力和国产大模型,迎来双赢时刻

星火语音大模型诞生的意义,不仅仅是成为更高效和智能的生产力,科大讯飞的判断是,语音交互,能加速万物互联时代的到来。

来自主题: AI资讯
6387 点击    2024-02-01 11:54