
国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类
国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类近期,港中大(深圳)联手趣丸科技联合推出了新一代大规模声音克隆 TTS 模型 ——MaskGCT。该模型在包含 10 万小时多语言数据的 Emilia 数据集上进行训练,展现出超自然的语音克隆、风格迁移以及跨语言生成能力,同时保持了较强的稳定性。MaskGCT 已在香港中文大学(深圳)与上海人工智能实验室联合开发的开源系统 Amphion 发布。
来自主题: AI技术研报
3082 点击 2024-10-30 13:57