AI资讯新闻榜单内容搜索-AI语音

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI语音
今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

OpenAI凌晨发布最新生产级别语音模型和API。Realtime API实现语音直接处理,支持图像输入、远程MCP服务器与SIP打电话,极大简化语音智能体构建;而新一代语音到语音模型gpt-realtime,在音质、理解力、指令遵循和函数调用上全面提升,语音几乎媲美真人,还能多语种切换与细腻表达。

来自主题: AI资讯
8016 点击    2025-08-29 14:20
470万美元种子轮背后:这位华人CEO如何用语音AI征服硅谷投资人?

470万美元种子轮背后:这位华人CEO如何用语音AI征服硅谷投资人?

470万美元种子轮背后:这位华人CEO如何用语音AI征服硅谷投资人?

一个月前在德国被50多家投资人拒绝的AI创业公司,搬到硅谷后却能在一周内完成470万美元的融资,而且投资人几乎全部说"yes"。这不是什么励志鸡汤故事,而是Leaping AI创始人Kevin Wu的真实经历。

来自主题: AI资讯
7086 点击    2025-08-26 19:40
独家|上交投资的首家语音大模型宇生月伴完成数千万元融资,加速走向全球,技术指标全面超越11Labs

独家|上交投资的首家语音大模型宇生月伴完成数千万元融资,加速走向全球,技术指标全面超越11Labs

独家|上交投资的首家语音大模型宇生月伴完成数千万元融资,加速走向全球,技术指标全面超越11Labs

情感语音交互模型初创公司宇生月伴近日完成新一轮融资,由靖亚资本和小苗朗程领投,菡源资产(上海交大母基金)跟投,心流资本FlowCapital担任长期财务顾问。本轮融资将用于语音模型的持续优化、产品矩阵拓展及国际化商业落地。作为国内首家聚焦“情感语音交互”的模型公司,宇生月伴正重新定义AI时代的语音交互范式。

来自主题: AI资讯
8864 点击    2025-08-19 22:13
速递|Reddit创始人押注840万!Palabra攻克AI语音翻译“拟真实时”难题

速递|Reddit创始人押注840万!Palabra攻克AI语音翻译“拟真实时”难题

速递|Reddit创始人押注840万!Palabra攻克AI语音翻译“拟真实时”难题

一家名为Palabra AI 的初创公司正在开发 AI 语音翻译引擎,致力于解决教学大型语言模型(LLMs)理解多种语言这一颇具挑战性的难题。

来自主题: AI资讯
7441 点击    2025-08-16 15:43
豆包上新同声传译,顺便狙击阿里AI眼镜?

豆包上新同声传译,顺便狙击阿里AI眼镜?

豆包上新同声传译,顺便狙击阿里AI眼镜?

AI语音成大厂必争之地 打开字节、阿里们的多模态能力地图,每块宝藏都标着"语音”。

来自主题: AI资讯
7356 点击    2025-07-28 10:23
Mistral发布首款开源AI音频模型Voxtral​

Mistral发布首款开源AI音频模型Voxtral​

Mistral发布首款开源AI音频模型Voxtral​

随着 AI 系统越来越强大,人们与机器的交流方式也在发生变化。语音,正在迅速成为默认的交互入口。

来自主题: AI资讯
7704 点击    2025-07-16 16:32
完全透明开源的共情语音大模型,三阶段训练,四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S

完全透明开源的共情语音大模型,三阶段训练,四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S

完全透明开源的共情语音大模型,三阶段训练,四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S

GPT-4o、Gemini这些顶级语音模型虽然展现了惊人的共情对话能力,但它们的技术体系完全闭源。

来自主题: AI技术研报
8474 点击    2025-07-16 16:30