ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
音乐的门槛,又一次被AI拉低了
8160点击    2024-06-01 17:48

第一批AI音乐的听众群,正在Suno的社区中被培养出来。


被誉为音乐界ChatGPT的Suno,最近宣布完成了B轮1.25 亿美元的融资。据推测,此轮融资使这家刚成立两年、总部位于马萨诸塞州的公司估值达到5亿美元。截至2024年初,公司员工总数仅为12人。


公司还顺手放出了新的模型V3.5。新版本让AI生成歌曲的时长达到4分钟,而且显著改进歌曲结构与声音模型,很明显的就是歌曲的副歌部分更突出了。另一个官方只浅浅描述并称“Coming soon”的功能,似乎是由声音生成声音,把真实世界中的声响转化为音乐。如果在V4版本中这一功能实现,确实为AI音乐生成提供了无限的可能。


据国内AI产品榜(aicpb.com)数据,Suno实现了连续每月千万级的访问增长量。在AI音乐生成领域,Suno月访问量是第二名的八倍之多,可谓是一骑绝尘


Suno 联合创始人兼首席执行官Mikey Shulman直言,“创办 Suno 是为了打造一个任何人都可以制作音乐的未来,帮助人们重新发现我们小时候玩耍和探索的乐趣”。他的终极愿景,是全球有10亿人每月支付10美元使用Suno创作歌曲。



不只是AI工具,还是音乐社区


“在人生的某个阶段,我们失去了制作音乐的一些乐趣。我们中的一些人长大后成为了真正的音乐家,接受了必要的训练或拥有天生的技能,而我们其他人则开始明白,我们的位置就是安静地坐在观众席上欣赏演出。”在宣布融资消息的公开信中,Suno 联合创始人兼首席执行官Mikey Shulman写道。


八个月前Suno发布了第一款产品,宣称让任何人只要有一个简单的想法就能创作出一首歌。现在已有1000 万人使用 Suno 创作音乐。这其中有格莱美获奖的音乐家,但大部分还是第一次尝试创作音乐的普通用户。


Suno的主页很简单,在左侧菜单栏里选择Create就可以进行歌曲创作。在Custom Mode中开启定制模式,可以粘贴自己创作的歌词,也可以让AI根据主题生成歌词,然后简单选择一下音乐风格,确定一个歌曲名,就可以自动生成歌曲。


自V3版本开始,Suno可以说在AI音乐创作工具中爆火。最多十几秒,即可生成2分钟音乐,包含人声、具有复杂曲式结构、听感不亚于专业音乐作品。此外,还有丰富的曲风流派和音响效果供选择。产品一出就惊艳了全世界。


在刚刚推出的V3.5中,AI生成的音乐又有大幅改善。不但时间更长了,还明显感觉作曲中逻辑性更强了。也就是说,AI可以理解歌词,区分主歌副歌,设定作品的结构,让作品更精巧。即使没有专业的音乐知识或乐器演奏基础,普通人也能通过这些工具创作出高质量的音乐作品。作品还有自动生成的封面,用户可以下载音频进而分享作品。


Suno取得成功的另一要素是,它不仅是个AI音乐生成工具,还是个音乐平台和音乐社区。在首页中,你能看到新鲜的AI作品案例,还能看到最受欢迎的作品排行榜,更有分门别类的播放列表供选择。你也可以通过名字、风格或歌词内容搜索作品。你能看到其他用户发布的作品,看到作品的播放量和点赞量,也可以分享自己的作品。


如果你不知道自己想做哪种类型的音乐,在Explore功能中,有数百中细分的音乐风格供你试听选择。你可以选择钟意的音乐风格,一键跳到Create页面。


以往大多AIGC产品,大家只是新鲜一阵,热闹过去就人走茶凉了。但Suno却神奇地保留了用户粘性,还在自己的社区推广、制造了大量神曲,这些神曲破圈后又吸引了大量路人来打卡、尝试AI创作。


最惊人的是,每天登陆网站的人中,听歌的人比真正去生成音乐的人还多。第一批AI音乐的听众群,正在Suno的社区中被培养出来。



创始人是AI专家,也是音乐家


一段时间里,像Midjourney这样AI生成图像、文本,甚至视频的工具都取得了重大进展,但音频生成,尤其是音乐生成,却落后了,也鲜有破圈的应用。Suno 身上则寄托了破解AI音乐密码的行业期待。


Suno 刚成立不到两年。四名联合创始人都是机器学习专家,他们曾在另一家剑桥公司 Kensho Technologies 共事至 2022 年,该公司专注于寻找解决复杂商业问题的 AI 解决方案。其中,37岁的 Mikey Shulman拥有哈佛大学物理学博士学位,他和另一名创始人也都是音乐家,曾一起演出。


在前一家公司,四人致力于开发一种转录技术,用于记录上市公司的财报电话会议,因为会议通话音频质量差、行话太多、口音各异,这是一项棘手的任务。在此过程中,Mikey Shulman和他的同事们开始研究AI音频的可能性。他也发现,在AI研究中,音频总体上远远落后于图像和文本。



他们在头脑风暴中预设过开发包括助听器在内各种各样的产品,结果第一个产品是一款名为Bark的文本转语音程序。当他们调查早期Bark 用户时,大家表示真正想要的是一个音乐生成器。


Suno 使用与 ChatGPT 等大型语言模型相同的通用方法,将人类语言分解并标记成片段,然后根据需要重建它。但音频,尤其是音乐,几乎复杂得令人难以置信。音频不像单词那样可以被简单分解,它是一个连续的信号。高质量音频的采样率通常为 44khz或48khz,这意味着每秒 48000 个标记,这是一个很大的工程量。在2023年,AI专家还觉得Suno 这样的服务可能需要数年时间才能实现。


还有一个绕不过去的问题,就是版权。现在,使用Suno时,系统可以识别你输入的歌词是否受版权保护。如果用户计划使用受版权保护的歌词,必须征得许可。


但该Suno的主要争议在于,它是否利用受版权保护材料进行训练。OpenAI 因 ChatGPT 在其庞大的训练数据中使用书籍、新闻文章和其他受版权保护的材料而面临多起诉讼。有媒体要求 Suno 澄清这一点,但未得到答复。Suno 的创始人拒绝透露他们究竟将哪些数据塞入自己的模型,只透露了一点:它之所以能够生成令人信服的人类声音,部分原因是它除了从音乐中学习外,还从语音录音中学习。



Suno 表示,他们与各大唱片公司保持着沟通,并声称尊重艺术家和知识产权——他们的工具不允许你在提示中要求任何特定艺术家的风格,也不会使用真实艺术家的声音。


从创始人到员工中,许多人都是音乐家。公司的办公室里也摆放着钢琴和吉他,墙上挂着古典作曲家的照片。Suno并没有像当年Napster那样,表现出对音乐行业的公开敌意。但他们在做的事情,确实正在颠覆音乐行业的逻辑。


目标触及10亿用户,超越Spotify?


Suno创始人毫不掩饰自己的野心,他们想象着一个高度民主化的音乐世界。Mikey Shulman认为,目前音乐听众的数量远远超过音乐创作者的数量是“如此不平衡”,Suno 有望解决这种明显的不平衡。他的愿景是全球有10亿人每月支付10美元使用Suno创作歌曲。


Suno 最早的投资者之一是风险投资公司 Matrix 的合伙人Antonio Rodriguez。他认为 Suno 是一款功能强大且易于使用的乐器,并相信它可以将音乐创作带给每个人,就像照相手机和 Instagram 使摄影大众化一样。他和创始人甚至认为 Suno 可以吸引比 Spotify 更大的用户群。


获得新融资后,Mikey Shulman也宣布这笔钱将用来“打造人人都能创作音乐的未来”。对此,投资人表示全力支持,“所有伟大的公司都拥有优秀人才的组合,做些看似愚蠢的事,直到这事变得明显不愚蠢为止。”



到目前为止,Suno 用户似乎只热衷于将他们的歌曲分享给几个朋友,但也可以将它们上传到Spotify或 Apple Music 等平台。不排除一种可能,未来流媒体上充斥着AI生成的音乐。


AI会不会颠覆当下音乐行业的商业模式,一直是歌手、制作人和词曲作者热衷讨论的话题。但 Suno 的创始人声称没什么可担心的,“我们试图让10亿人比现在更多地参与音乐,如果人们更热衷于音乐,更专注于创作,培养出更独特的品味,这显然对艺术家来说是好事。我们对音乐未来的愿景是,它对艺术家友好。我们并不是想取代艺术家。”


但AI确实也在替代唱片行业中一些基础工作。ChatGPT可以帮助写词,Suno可以直接生成音乐,ACE可以帮助混音,甚至使用Mid journey、Runway、Sora可以帮助生成宣传图和MV。工业时代的音乐制作需要多个工种配合,也许以后只需要一个专业的人整体把关就足够。


尽管 Suno 只专注于吸引那些想创作歌曲以取乐的爱好者们,但在音乐行业人士的眼里,它仍可能造成重大破坏。像往常利润丰厚的广告配乐,未来是不是就都会由AI接手?


但对Suno来说,当下还有很多工作亟待完成。新的融资到账后,公司需要继续扩大规模,推出新的产品。在Mikey Shulman看来,还原已故歌手的声音这种操作不是人工智能未来的方向,他们考虑的是怎么把人们头脑中的想法变成现实,创作出原本不存在的作品。

也许等新技术连续落地后,现在的很多问题才会找到答案。


文章来源于“新音乐产业观察”,作者“益佰


关键词: AI音乐 , AI声音 , 大模型 , LLM
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI音乐

【开源免费】suno-api是一个使用监听技术实现了调用suno功能,并封装好API的AI音乐项目。

项目地址:https://github.com/gcui-art/suno-api