AI资讯新闻榜单内容搜索-Ai语音

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: Ai语音
2行代码与DeepSeek语音对话,1分钟不到一毛钱,所有大模型都能开口说话

2行代码与DeepSeek语音对话,1分钟不到一毛钱,所有大模型都能开口说话

2行代码与DeepSeek语音对话,1分钟不到一毛钱,所有大模型都能开口说话

起猛了,DeepSeek开口说话了。而且是超低延迟实时秒回,还可以随时打断的那种,先来看一段VCR:DeepSeek以及其他任意大模型接入这样的高质量对话引擎,全程只需要两行代码。

来自主题: AI资讯
7673 点击    2025-03-09 11:07
估值33亿美金的AI语音合成独角兽Eleven Labs是怎么跑出来的?

估值33亿美金的AI语音合成独角兽Eleven Labs是怎么跑出来的?

估值33亿美金的AI语音合成独角兽Eleven Labs是怎么跑出来的?

ElevenLabs 似乎无处不在。2025年 1 月,Lex Fridman在基辅对乌克兰总统Zelenskyy进行了长达三小时的采访,采访中使用了ElevenLabs 提供的AI英语、乌克兰语和俄语翻译,完美地保留了泽连斯基的语音和语调。这是AI消除语言障碍能力的一次引人注目的展示。

来自主题: AI资讯
7927 点击    2025-02-17 09:29
a16z:2025年AI语音智能体(AI Voice Agents)该怎么投?

a16z:2025年AI语音智能体(AI Voice Agents)该怎么投?

a16z:2025年AI语音智能体(AI Voice Agents)该怎么投?

语音是人工智能应用公司最重大的突破之一。作为人类最常用、信息密度最高的交流方式,语音如今在人工智能的推动下首次实现了“可编程化”。

来自主题: AI资讯
4025 点击    2025-02-08 15:50
ChatGPT Voice之父离职创办语音模型公司,种子轮即获a16z 4000万美金,估值数亿美元

ChatGPT Voice之父离职创办语音模型公司,种子轮即获a16z 4000万美金,估值数亿美元

ChatGPT Voice之父离职创办语音模型公司,种子轮即获a16z 4000万美金,估值数亿美元

WaveForms致力于开发音频大模型(LLMs),通过创新的端到端音频处理技术,实现更加实时、类人化且情感智能化的语音交互。与传统语音模型不同,WaveForms的音频模型不是语音转文本再转语音,而是能够直接处理音频,实现更自然的对话和情感互动。

来自主题: AI资讯
3780 点击    2025-01-22 10:01
MiniMax海螺语音全球同步上线,文生音能力赶超ElevenLabs

MiniMax海螺语音全球同步上线,文生音能力赶超ElevenLabs

MiniMax海螺语音全球同步上线,文生音能力赶超ElevenLabs

继视频、文本模型家族在新年迎来新成员后,MiniMax带来了全新升级的T2A-01系列语音模型,并全球同步上线海螺语音产品。与传统语音生成技术相比,全新升级的T2A-01系列语音模型不仅具有音质稳定清晰、韵律自然、情绪精准表达、高准确度等特点。

来自主题: AI资讯
7589 点击    2025-01-20 14:38
小米语音首席科学家 Daniel Povey:语音识别卷完了,下一个机会在哪里?

小米语音首席科学家 Daniel Povey:语音识别卷完了,下一个机会在哪里?

小米语音首席科学家 Daniel Povey:语音识别卷完了,下一个机会在哪里?

本期《智者访谈》邀请到著名开源语音识别项目 Kaldi 的创始人、小米集团语音首席科学家 Daniel Povey 博士。作为推动全球智能语音处理产业化的关键人物,他见证了语音识别技术从实验室走向大规模应用的全过程。十多年前,他在微软研究院的实习生,如今已成为 Google Gemini 等标志性项目的负责人。

来自主题: AI资讯
6678 点击    2025-01-19 15:02
OpenAI押注,这家语音AI初创如何扛起10亿美元估值?

OpenAI押注,这家语音AI初创如何扛起10亿美元估值?

OpenAI押注,这家语音AI初创如何扛起10亿美元估值?

Accel的合伙人Ben Quazzo将在融资后加入Speak董事会,他认为Speak已经成为消费级AI中的佼佼者,不仅增长迅猛,还展现出了巨大的市场潜力,重新定义了语言学习体验。

来自主题: AI资讯
6833 点击    2025-01-03 14:33
Hume AI发布全能语音引擎OCTAVE:文本秒变真人声,克隆人格特征

Hume AI发布全能语音引擎OCTAVE:文本秒变真人声,克隆人格特征

Hume AI发布全能语音引擎OCTAVE:文本秒变真人声,克隆人格特征

Hume AI近日推出了一款名为OCTAVE的全新文本与语音引擎,该引擎能够仅凭简单的文本描述或一段5秒的语音录音,即可生成或克隆出逼真的语音和人格特质,为虚拟角色和人机交互带来了无限可能。

来自主题: AI资讯
7150 点击    2024-12-25 09:44