AI资讯新闻榜单内容搜索-Ai语音

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Ai语音

一个真正意义上的实时多模态智能体框架，TEN Framework 为构建下一代 AI Agent 而生

一个真正意义上的实时多模态智能体框架，TEN Framework 为构建下一代 AI Agent 而生

一个真正意义上的实时多模态智能体框架，TEN Framework 为构建下一代 AI Agent 而生

有了 TEN（Transformative Extensions Network，变革性扩展网络），开发者们终于不用再「绞尽脑汁」了！TEN 是全球首个真正实现实时多模态智能体的框架，不仅能减少开发痛点，还让你轻松从头开始构建下一代 AI 应用。

来自主题: AI资讯

6972 点击 2024-10-30 15:55

国产最强语音大模型诞生，MaskGCT宣布开源，声音效果媲美人类

国产最强语音大模型诞生，MaskGCT宣布开源，声音效果媲美人类

国产最强语音大模型诞生，MaskGCT宣布开源，声音效果媲美人类

近期，港中大（深圳）联手趣丸科技联合推出了新一代大规模声音克隆 TTS 模型 ——MaskGCT。该模型在包含 10 万小时多语言数据的 Emilia 数据集上进行训练，展现出超自然的语音克隆、风格迁移以及跨语言生成能力，同时保持了较强的稳定性。MaskGCT 已在香港中文大学（深圳）与上海人工智能实验室联合开发的开源系统 Amphion 发布。

来自主题: AI技术研报

4752 点击 2024-10-30 13:57

OpenAI语音转录工具被曝严重幻觉：转录100小时，一半儿在瞎扯

OpenAI语音转录工具被曝严重幻觉：转录100小时，一半儿在瞎扯

OpenAI语音转录工具被曝严重幻觉：转录100小时，一半儿在瞎扯

OpenAI的AI语音转写工具，那个号称近乎“人类水平”的Whisper，被曝幻觉严重—— 100多小时转录，被工程师发现约一半都在瞎扯。更严重的是，美联社还爆料有医疗机构利用Whisper来转录医生与患者的会诊，瞬间引发大量网友关注。

来自主题: AI资讯

3973 点击 2024-10-27 15:22

智谱AI上线最新“自主智能体”，“Her”终于能照进现实了

智谱AI上线最新“自主智能体”，“Her”终于能照进现实了

智谱AI上线最新“自主智能体”，“Her”终于能照进现实了

在对标OpenAI之路上，智谱AI又近了一步。今年年初，OpenAI被爆出将自研AI Agent软件，它可替代人类，自动导航至任何网站并执行指定任务。

来自主题: AI资讯

4314 点击 2024-10-26 11:38

让Kimi和GPT-4o用语音功能相亲，两个AI差点谈上了

让Kimi和GPT-4o用语音功能相亲，两个AI差点谈上了

让Kimi和GPT-4o用语音功能相亲，两个AI差点谈上了

昨天，Kimi突然给我打了个电话，我这才发现自己被“灰度”了。灰度测试的内容是Kimi的语音通话功能。现在进入Kimi App，就能看到底部问答框旁边多了一个电话的图标，点击即可发起语音通话。

来自主题: AI资讯

4453 点击 2024-10-21 11:23

雷军国庆将网友“骂”了整整七天，AI语音方向错了？

雷军国庆将网友“骂”了整整七天，AI语音方向错了？

雷军国庆将网友“骂”了整整七天，AI语音方向错了？

只需3秒，你的声音就能被完美克隆。谁能想到科技圈顶流之一的雷军，居然因为AI语音引起互联网热议？

来自主题: AI资讯

4272 点击 2024-10-09 10:59

AI语音独角兽遭机构争抢，或将估值30亿美元，ARR的38倍

AI语音独角兽遭机构争抢，或将估值30亿美元，ARR的38倍

AI语音独角兽遭机构争抢，或将估值30亿美元，ARR的38倍

据TechCrunch报道，投资者们正争相进入 ElevenLabs，该公司可能很快就会被估值为 30 亿美元。

来自主题: AI资讯

3363 点击 2024-10-05 11:43

OpenAI 开发者大会！实时语音功能有API了，GPT-4o支持多模态微调，上下文cache功能上线

OpenAI 开发者大会！实时语音功能有API了，GPT-4o支持多模态微调，上下文cache功能上线

OpenAI 开发者大会！实时语音功能有API了，GPT-4o支持多模态微调，上下文cache功能上线

十一假期第1天， OpenAI一年一度的开发者大会又来了惹！今年的开发者大会分成三部分分别在美国、英国、新加坡三个地点举办，刚刚结束的是第一场。

来自主题: AI资讯

3808 点击 2024-10-03 13:07

遭GPT-4o碾压，豆包们直面语音AI生死战

遭GPT-4o碾压，豆包们直面语音AI生死战

遭GPT-4o碾压，豆包们直面语音AI生死战

在算力资源的匮乏下，中国的实时语音AI正面临着一场艰难的较量，试图在技术舞台上与GPT-4o一决高下，这无疑是当前中国AI版图中的尴尬局面。

来自主题: AI资讯

4466 点击 2024-10-01 11:25

150万条多语种音频数据！浙大清华发布语音伪造检测框架SafeEar，兼顾隐私保护｜CCS 2024

150万条多语种音频数据！浙大清华发布语音伪造检测框架SafeEar，兼顾隐私保护｜CCS 2024

150万条多语种音频数据！浙大清华发布语音伪造检测框架SafeEar，兼顾隐私保护｜CCS 2024

SafeEar是一种内容隐私保护的语音伪造检测方法，其核心是设计基于神经音频编解码器的解耦模型，分离语音声学与语义信息，仅利用声学信息检测，包括前端解耦模型、瓶颈层和混淆层、伪造检测器、真实环境增强四部分。

来自主题: AI技术研报

10104 点击 2024-09-26 15:25

上一页当前第9页,共11页下一页