
AI语音迎来「特斯拉时刻」,一条工作流「吃掉」全球百亿市场
AI语音迎来「特斯拉时刻」,一条工作流「吃掉」全球百亿市场“最强AI语音”的场景化突围。
“最强AI语音”的场景化突围。
最近,Tinder与OpenAI合作,推出了一款名为"Game Game"的AI语音调情游戏,号称能让用户在模拟约会场景中练习调情技巧。用户可以通过与 AI 机器人互动,练习调情、模拟初次相遇场景,并根据表现获得评分和建议。
2025 年 3 月 11 日,语音生成初创公司 Cartesia 宣布完成 6400 万美元 A 轮融资,距其 2700 万美元种子轮融资仅过去不到 3 个月。本轮融资由 Kleiner Perkins 领投,Lightspeed、Index、A*、Greycroft、Dell Technologies Capital 和 Samsung Ventures 等跟投。
(用户的)信任是要靠争取的,如果模型在设计时没有考虑到这一点,它们就永远无法发挥出全部潜力。
红杉资本、A16Z 最近讨论了对语音人工智能初创公司 Sesame 的融资。该公司专注于开发人工智能语音助手和可穿戴设备。
语音恐怖谷是指在语音合成技术中,当 AI 合成语音接近人类的真实语音,但又存在细微的不自然或不完美之处时,会引发人类的不适感。
语音Agent市场在2024年下半年迎来爆发式增长。据Cartesia统计,在最新一届YC中,构建语音相关产品的公司占比达22%。
相比让Alexa重新焕发生机,AI可能会产生的幻觉或只是个小问题。
起猛了,DeepSeek开口说话了。而且是超低延迟实时秒回,还可以随时打断的那种,先来看一段VCR:DeepSeek以及其他任意大模型接入这样的高质量对话引擎,全程只需要两行代码。
ElevenLabs 似乎无处不在。2025年 1 月,Lex Fridman在基辅对乌克兰总统Zelenskyy进行了长达三小时的采访,采访中使用了ElevenLabs 提供的AI英语、乌克兰语和俄语翻译,完美地保留了泽连斯基的语音和语调。这是AI消除语言障碍能力的一次引人注目的展示。