国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类
国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类近期,港中大(深圳)联手趣丸科技联合推出了新一代大规模声音克隆 TTS 模型 ——MaskGCT。该模型在包含 10 万小时多语言数据的 Emilia 数据集上进行训练,展现出超自然的语音克隆、风格迁移以及跨语言生成能力,同时保持了较强的稳定性。MaskGCT 已在香港中文大学(深圳)与上海人工智能实验室联合开发的开源系统 Amphion 发布。
近期,港中大(深圳)联手趣丸科技联合推出了新一代大规模声音克隆 TTS 模型 ——MaskGCT。该模型在包含 10 万小时多语言数据的 Emilia 数据集上进行训练,展现出超自然的语音克隆、风格迁移以及跨语言生成能力,同时保持了较强的稳定性。MaskGCT 已在香港中文大学(深圳)与上海人工智能实验室联合开发的开源系统 Amphion 发布。
做底层大模型研发,就像一场旷日持久的马拉松,研发成本高、技术门槛高,迭代竞争激烈。拿 OpenAI 来说,研发带来的年亏损高达 50 亿美元。这样的财务压力显然不是一般的 AI 公司所能承受之重。AI 创业公司也往往显得十分务实,始终将商业化和盈利变现作为核心考量。
创业9个月不到,李洋光是技术研发投入就烧光了2000万元,8月现金流断裂后,离开大厂,曾经想“用AGI改变世界”的李洋,创业未半,中道还背上了债务。
让大模型能快速、准确、高效地吸收新知识!
MiniMax的最新消息想必大家都知道了,外媒曝出MiniMax的预计年收入:7000万美金。这也给“大模型公司找不到PMF(产品-市场匹配度)”的论断,一记有力的反驳。
大模型开源的口号,不是随便说说的。
AI造就新的烹饪和生活方式。2024 年,AI 席卷各行各业不仅没有放缓,甚至还愈演愈烈,厨电领域也不例外。
Grok 大模型终于能看懂图像了。
做好研发投入和成本控制的平衡,成为智驾比拼输赢的关键。
逐鹿AI大舞台,谁将脱颖而出,引领风骚 人工智能浪潮的掀起,世界正迎来一场前所未有的技术革命。