ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
1分钟复刻明星语音,这家AI创企开年跻身独角兽
7627点击    2024-01-23 14:47

2024年第一个月,又一AI初创公司跻身独角兽:


专注于AI语音合成的ElevenLabs,刚刚完成8000万美元(约合人民币5.7亿元)B轮融资,估值超过10亿美元。



在语音克隆领域,ElevenLabs(11Labs)是公认的最强工具之一。



因霉霉说中文、郭德纲说英语相声视频而红极一时的HeyGen,就使用了11Labs的音频产品。



而现在,新一轮融资佐证了资本市场对这家初创企业的看好:


11Labs从估值1亿美元到估值10亿美元,只过去了半年时间。


前谷歌工程师创办


ElevenLabs创办于2022年,两位联合创始人分别是前谷歌机器学习工程师Piotr Dabkowski和前Palantir策略分析师Mati Staniszewski。



这俩波兰小伙创办11Labs的初衷还挺有意思:小时候看的好莱坞电影波兰语配音太烂,是时候用AI拯救一下了。


2023年,11Labs开始逐步推出他们的语音模型,包括文字转语音(TTS)、声音克隆等。


现在,11Labs能实现29个语种的语音生成。比如说中文,是酱婶的:


官网博客文章的语音版,也均由自家AI生成。


这次这家AI语音公司的融资稿,就是AI念的:


更绝的是,仅需要短至1分钟的音频素材,11Labs就能很好地“克隆”任何一个人的声音,连语调和情绪变化都能模仿到位的那种。


费用方面,11Labs提供了每月10000字符的免费使用额度,包括文本生成语音和语音生成语音服务。



语音克隆,则需要订阅最低首月1美元/月的会员服务。



目前,11Labs的客户覆盖媒体、游戏等诸多领域,比如P社和网易就都与他们达成了合作。


本次融资,由a16z、GitHub前首席执行官Nat Friedman和前YC合伙人Daniel Gross共同领投,红杉资本、SV Angel、Smash Capital、BroadLight Capital和Credo Ventures跟投。

拿到这笔融资之后,用现任CTO的Piotr Dabkowski的说法,11Labs会“专注于保持在研究和产品开发方面的竞争优势”。


招聘也正在进行时:这支40人的团队计划在年底扩充至百人规模。


就在接下来几周,11Labs计划推出以下新产品:


  • AI Dubbing Studio:为电影配音服务,功能包括配音生成,以及编辑文本、翻译和时间戳等等。

  • 语音库市场:用户可以在这个平台上售卖自己创建的AI语音副本。

  • 移动端App早期版本

One More Thing


说起来,似乎不少AI初创公司都钟情于数字+Labs的组合。


11Labs专注语音AI,还有一家12Labs正在搞视频理解。



p.s. 如果你也有了一点大胆的想法,温馨提示,从7到15的数字都被占了(手动狗头)。


参考链接:

[1]https://elevenlabs.io/blog/series-b/

[2]https://techcrunch.com/2024/01/22/voice-cloning-startup-elevenlabs-lands-80m-achieves-unicorn-status/


文章来自于微信公众号“量子位”(ID: QbitAI),作者 “鱼羊”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
声音克隆

【开源免费】MockingBird是一个5秒钟即可克隆你的声音的AI项目。

项目地址:https://github.com/babysor/MockingBird

2
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales