AI资讯新闻榜单内容搜索-AI语音

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: AI语音
小米语音首席科学家 Daniel Povey:语音识别卷完了,下一个机会在哪里?

小米语音首席科学家 Daniel Povey:语音识别卷完了,下一个机会在哪里?

小米语音首席科学家 Daniel Povey:语音识别卷完了,下一个机会在哪里?

本期《智者访谈》邀请到著名开源语音识别项目 Kaldi 的创始人、小米集团语音首席科学家 Daniel Povey 博士。作为推动全球智能语音处理产业化的关键人物,他见证了语音识别技术从实验室走向大规模应用的全过程。十多年前,他在微软研究院的实习生,如今已成为 Google Gemini 等标志性项目的负责人。

来自主题: AI资讯
6657 点击    2025-01-19 15:02
OpenAI押注,这家语音AI初创如何扛起10亿美元估值?

OpenAI押注,这家语音AI初创如何扛起10亿美元估值?

OpenAI押注,这家语音AI初创如何扛起10亿美元估值?

Accel的合伙人Ben Quazzo将在融资后加入Speak董事会,他认为Speak已经成为消费级AI中的佼佼者,不仅增长迅猛,还展现出了巨大的市场潜力,重新定义了语言学习体验。

来自主题: AI资讯
6803 点击    2025-01-03 14:33
Hume AI发布全能语音引擎OCTAVE:文本秒变真人声,克隆人格特征

Hume AI发布全能语音引擎OCTAVE:文本秒变真人声,克隆人格特征

Hume AI发布全能语音引擎OCTAVE:文本秒变真人声,克隆人格特征

Hume AI近日推出了一款名为OCTAVE的全新文本与语音引擎,该引擎能够仅凭简单的文本描述或一段5秒的语音录音,即可生成或克隆出逼真的语音和人格特质,为虚拟角色和人机交互带来了无限可能。

来自主题: AI资讯
7122 点击    2024-12-25 09:44
深度|OpenAI实时API技术细节揭秘,实时API支持函数调用和上下文管理,简化了多轮对话中的对话历史管理

深度|OpenAI实时API技术细节揭秘,实时API支持函数调用和上下文管理,简化了多轮对话中的对话历史管理

深度|OpenAI实时API技术细节揭秘,实时API支持函数调用和上下文管理,简化了多轮对话中的对话历史管理

OpenAI的实时API支持低延迟、双向音频流,使得多模态AI应用(如语音对话Agent)得以实现。它通过WebSocket连接管理对话状态,并提供短语结束检测和语音活动检测(VAD)功能,大大简化了实时语音应用的开发。

来自主题: AI资讯
7243 点击    2024-12-13 17:05
WebRTC创建者加入了OpenAI,他如何思考语音AI的未来?

WebRTC创建者加入了OpenAI,他如何思考语音AI的未来?

WebRTC创建者加入了OpenAI,他如何思考语音AI的未来?

WebRTC 的早期创建者之一,Fixie.ai 联合创始人兼 CTO Justin Uberti 近日宣布加入 OpenAI,领导实时 AI (Real-Time AI)项目的开发。

来自主题: AI资讯
4644 点击    2024-12-12 11:19
Z Product | 硅谷大厂开始行动,这家成立两年的AI语音公司被收购:语音是最本能的沟通手段

Z Product | 硅谷大厂开始行动,这家成立两年的AI语音公司被收购:语音是最本能的沟通手段

Z Product | 硅谷大厂开始行动,这家成立两年的AI语音公司被收购:语音是最本能的沟通手段

Tenyx利用AI和ML,打破传统IVR系统的局限,为多元化行业提供精准、自然的语音交互解决方案,引领客户服务领域的技术革命。

来自主题: AI资讯
6935 点击    2024-12-09 09:41
PlayAI获得2100万美元种子资金专注类人AI语音模型

PlayAI获得2100万美元种子资金专注类人AI语音模型

PlayAI获得2100万美元种子资金专注类人AI语音模型

人工智能语音初创公司PlayAI宣布在种子轮融资中筹集了2100万美元。该公司表示,将利用这笔资金投资于其生成式人工智能(GenAI)语音模型和语音代理平台。

来自主题: AI资讯
5037 点击    2024-12-01 11:32