
Z Product | 硅谷大厂开始行动,这家成立两年的AI语音公司被收购:语音是最本能的沟通手段
Z Product | 硅谷大厂开始行动,这家成立两年的AI语音公司被收购:语音是最本能的沟通手段Tenyx利用AI和ML,打破传统IVR系统的局限,为多元化行业提供精准、自然的语音交互解决方案,引领客户服务领域的技术革命。
Tenyx利用AI和ML,打破传统IVR系统的局限,为多元化行业提供精准、自然的语音交互解决方案,引领客户服务领域的技术革命。
人工智能语音初创公司PlayAI宣布在种子轮融资中筹集了2100万美元。该公司表示,将利用这笔资金投资于其生成式人工智能(GenAI)语音模型和语音代理平台。
近日,汤姆猫(SZ.300459)披露投资者关系活动,纪录表显示,汤姆猫正在研发的 AI 产品包括汤姆猫 AI 语音机器人、AI 讲故事 APP、 AI 游戏等系列产品。其中,第一代汤姆猫 AI 机器人产品预计春节前上市。
是否曾为项目寻找合适的声音而苦恼?无论是商业广告、播客还是教育视频,合适的声音都能带来截然不同的效果。现在,有了Murf AI的Speech Gen 2,这款先进的AI语音生成器将彻底改变你制作配音的方式。
「未来,消费者更可能倾向于与 AI 沟通,而非人工客服,因为这将成为解决问题的最高效途径。」
清华大学推出的SonicSim平台和SonicSet数据集针对动态声源的语音处理研究提供了强有力的工具和数据支持,有效降低了数据采集成本,实验证明这些工具能有效提升模型在真实环境中的性能。
GPT-4o 的语音演示,引燃了行业对于 AI 产品语音实时交互的想象,完全实时、可随时打断的 AI 助手,正成为新的 趋势。
有了 TEN(Transformative Extensions Network,变革性扩展网络),开发者们终于不用再「绞尽脑汁」了!TEN 是全球首个真正实现实时多模态智能体的框架,不仅能减少开发痛点,还让你轻松从头开始构建下一代 AI 应用。
近期,港中大(深圳)联手趣丸科技联合推出了新一代大规模声音克隆 TTS 模型 ——MaskGCT。该模型在包含 10 万小时多语言数据的 Emilia 数据集上进行训练,展现出超自然的语音克隆、风格迁移以及跨语言生成能力,同时保持了较强的稳定性。MaskGCT 已在香港中文大学(深圳)与上海人工智能实验室联合开发的开源系统 Amphion 发布。
OpenAI的AI语音转写工具,那个号称近乎“人类水平”的Whisper,被曝幻觉严重—— 100多小时转录,被工程师发现约一半都在瞎扯。 更严重的是,美联社还爆料有医疗机构利用Whisper来转录医生与患者的会诊,瞬间引发大量网友关注。