AI资讯新闻榜单内容搜索-AI语音

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: AI语音
国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类

国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类

国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类

近期,港中大(深圳)联手趣丸科技联合推出了新一代大规模声音克隆 TTS 模型 ——MaskGCT。该模型在包含 10 万小时多语言数据的 Emilia 数据集上进行训练,展现出超自然的语音克隆、风格迁移以及跨语言生成能力,同时保持了较强的稳定性。MaskGCT 已在香港中文大学(深圳)与上海人工智能实验室联合开发的开源系统 Amphion 发布。

来自主题: AI技术研报
3143 点击    2024-10-30 13:57
智谱AI上线最新“自主智能体”,“Her”终于能照进现实了

智谱AI上线最新“自主智能体”,“Her”终于能照进现实了

智谱AI上线最新“自主智能体”,“Her”终于能照进现实了

在对标OpenAI之路上,智谱AI又近了一步。 今年年初,OpenAI被爆出将自研AI Agent软件,它可替代人类,自动导航至任何网站并执行指定任务。

来自主题: AI资讯
2944 点击    2024-10-26 11:38
让Kimi和GPT-4o用语音功能相亲,两个AI差点谈上了

让Kimi和GPT-4o用语音功能相亲,两个AI差点谈上了

让Kimi和GPT-4o用语音功能相亲,两个AI差点谈上了

昨天,Kimi突然给我打了个电话,我这才发现自己被“灰度”了。 灰度测试的内容是Kimi的语音通话功能。 现在进入Kimi App,就能看到底部问答框旁边多了一个电话的图标,点击即可发起语音通话。

来自主题: AI资讯
3406 点击    2024-10-21 11:23
雷军国庆将网友“骂”了整整七天,AI语音方向错了?

雷军国庆将网友“骂”了整整七天,AI语音方向错了?

雷军国庆将网友“骂”了整整七天,AI语音方向错了?

只需3秒,你的声音就能被完美克隆。 谁能想到科技圈顶流之一的雷军,居然因为AI语音引起互联网热议?

来自主题: AI资讯
3455 点击    2024-10-09 10:59
AI语音独角兽遭机构争抢,或将估值30亿美元,ARR的38倍

AI语音独角兽遭机构争抢,或将估值30亿美元,ARR的38倍

AI语音独角兽遭机构争抢,或将估值30亿美元,ARR的38倍

据TechCrunch报道,投资者们正争相进入 ElevenLabs,该公司可能很快就会被估值为 30 亿美元。

来自主题: AI资讯
2118 点击    2024-10-05 11:43
OpenAI 开发者大会!实时语音功能有API了,GPT-4o支持多模态微调,上下文cache功能上线

OpenAI 开发者大会!实时语音功能有API了,GPT-4o支持多模态微调,上下文cache功能上线

OpenAI 开发者大会!实时语音功能有API了,GPT-4o支持多模态微调,上下文cache功能上线

十一假期第1天, OpenAI一年一度的开发者大会又来了惹!今年的开发者大会分成三部分分别在美国、英国、新加坡三个地点举办,刚刚结束的是第一场。

来自主题: AI资讯
2893 点击    2024-10-03 13:07
遭GPT-4o碾压,豆包们直面语音AI生死战

遭GPT-4o碾压,豆包们直面语音AI生死战

遭GPT-4o碾压,豆包们直面语音AI生死战

在算力资源的匮乏下,中国的实时语音AI正面临着一场艰难的较量,试图在技术舞台上与GPT-4o一决高下,这无疑是当前中国AI版图中的尴尬局面。

来自主题: AI资讯
3301 点击    2024-10-01 11:25
150万条多语种音频数据!浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护|CCS 2024

150万条多语种音频数据!浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护|CCS 2024

150万条多语种音频数据!浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护|CCS 2024

SafeEar是一种内容隐私保护的语音伪造检测方法,其核心是设计基于神经音频编解码器的解耦模型,分离语音声学与语义信息,仅利用声学信息检测,包括前端解耦模型、瓶颈层和混淆层、伪造检测器、真实环境增强四部分。

来自主题: AI技术研报
9425 点击    2024-09-26 15:25
讯飞版「Her」横空出世全民开放!百变人设逼真丝滑,情绪价值逆天

讯飞版「Her」横空出世全民开放!百变人设逼真丝滑,情绪价值逆天

讯飞版「Her」横空出世全民开放!百变人设逼真丝滑,情绪价值逆天

OpenAI的「Her」还是期货,讯飞星火版「Her」就抢先上线了!不仅极速响应自由打断,还情绪价值拉满,各种情感、风格、方言随意切换。熊二被召唤出来的时候,家里的熊孩子直接被硬控了30秒。

来自主题: AI资讯
6400 点击    2024-08-31 14:32
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员

语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员

语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员

继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。

来自主题: AI技术研报
9747 点击    2024-07-24 21:16