第一批AI音乐的听众群,正在Suno的社区中被培养出来。
被誉为音乐界ChatGPT的Suno,最近宣布完成了B轮1.25 亿美元的融资。据推测,此轮融资使这家刚成立两年、总部位于马萨诸塞州的公司估值达到5亿美元。截至2024年初,公司员工总数仅为12人。
公司还顺手放出了新的模型V3.5。新版本让AI生成歌曲的时长达到4分钟,而且显著改进歌曲结构与声音模型,很明显的就是歌曲的副歌部分更突出了。另一个官方只浅浅描述并称“Coming soon”的功能,似乎是由声音生成声音,把真实世界中的声响转化为音乐。如果在V4版本中这一功能实现,确实为AI音乐生成提供了无限的可能。
据国内AI产品榜(aicpb.com)数据,Suno实现了连续每月千万级的访问增长量。在AI音乐生成领域,Suno月访问量是第二名的八倍之多,可谓是一骑绝尘
Suno 联合创始人兼首席执行官Mikey Shulman直言,“创办 Suno 是为了打造一个任何人都可以制作音乐的未来,帮助人们重新发现我们小时候玩耍和探索的乐趣”。他的终极愿景,是全球有10亿人每月支付10美元使用Suno创作歌曲。
“在人生的某个阶段,我们失去了制作音乐的一些乐趣。我们中的一些人长大后成为了真正的音乐家,接受了必要的训练或拥有天生的技能,而我们其他人则开始明白,我们的位置就是安静地坐在观众席上欣赏演出。”在宣布融资消息的公开信中,Suno 联合创始人兼首席执行官Mikey Shulman写道。
八个月前Suno发布了第一款产品,宣称让任何人只要有一个简单的想法就能创作出一首歌。现在已有1000 万人使用 Suno 创作音乐。这其中有格莱美获奖的音乐家,但大部分还是第一次尝试创作音乐的普通用户。
Suno的主页很简单,在左侧菜单栏里选择Create就可以进行歌曲创作。在Custom Mode中开启定制模式,可以粘贴自己创作的歌词,也可以让AI根据主题生成歌词,然后简单选择一下音乐风格,确定一个歌曲名,就可以自动生成歌曲。
自V3版本开始,Suno可以说在AI音乐创作工具中爆火。最多十几秒,即可生成2分钟音乐,包含人声、具有复杂曲式结构、听感不亚于专业音乐作品。此外,还有丰富的曲风流派和音响效果供选择。产品一出就惊艳了全世界。
在刚刚推出的V3.5中,AI生成的音乐又有大幅改善。不但时间更长了,还明显感觉作曲中逻辑性更强了。也就是说,AI可以理解歌词,区分主歌副歌,设定作品的结构,让作品更精巧。即使没有专业的音乐知识或乐器演奏基础,普通人也能通过这些工具创作出高质量的音乐作品。作品还有自动生成的封面,用户可以下载音频进而分享作品。
Suno取得成功的另一要素是,它不仅是个AI音乐生成工具,还是个音乐平台和音乐社区。在首页中,你能看到新鲜的AI作品案例,还能看到最受欢迎的作品排行榜,更有分门别类的播放列表供选择。你也可以通过名字、风格或歌词内容搜索作品。你能看到其他用户发布的作品,看到作品的播放量和点赞量,也可以分享自己的作品。
如果你不知道自己想做哪种类型的音乐,在Explore功能中,有数百中细分的音乐风格供你试听选择。你可以选择钟意的音乐风格,一键跳到Create页面。
以往大多AIGC产品,大家只是新鲜一阵,热闹过去就人走茶凉了。但Suno却神奇地保留了用户粘性,还在自己的社区推广、制造了大量神曲,这些神曲破圈后又吸引了大量路人来打卡、尝试AI创作。
最惊人的是,每天登陆网站的人中,听歌的人比真正去生成音乐的人还多。第一批AI音乐的听众群,正在Suno的社区中被培养出来。
一段时间里,像Midjourney这样AI生成图像、文本,甚至视频的工具都取得了重大进展,但音频生成,尤其是音乐生成,却落后了,也鲜有破圈的应用。Suno 身上则寄托了破解AI音乐密码的行业期待。
Suno 刚成立不到两年。四名联合创始人都是机器学习专家,他们曾在另一家剑桥公司 Kensho Technologies 共事至 2022 年,该公司专注于寻找解决复杂商业问题的 AI 解决方案。其中,37岁的 Mikey Shulman拥有哈佛大学物理学博士学位,他和另一名创始人也都是音乐家,曾一起演出。
在前一家公司,四人致力于开发一种转录技术,用于记录上市公司的财报电话会议,因为会议通话音频质量差、行话太多、口音各异,这是一项棘手的任务。在此过程中,Mikey Shulman和他的同事们开始研究AI音频的可能性。他也发现,在AI研究中,音频总体上远远落后于图像和文本。
他们在头脑风暴中预设过开发包括助听器在内各种各样的产品,结果第一个产品是一款名为Bark的文本转语音程序。当他们调查早期Bark 用户时,大家表示真正想要的是一个音乐生成器。
Suno 使用与 ChatGPT 等大型语言模型相同的通用方法,将人类语言分解并标记成片段,然后根据需要重建它。但音频,尤其是音乐,几乎复杂得令人难以置信。音频不像单词那样可以被简单分解,它是一个连续的信号。高质量音频的采样率通常为 44khz或48khz,这意味着每秒 48000 个标记,这是一个很大的工程量。在2023年,AI专家还觉得Suno 这样的服务可能需要数年时间才能实现。
还有一个绕不过去的问题,就是版权。现在,使用Suno时,系统可以识别你输入的歌词是否受版权保护。如果用户计划使用受版权保护的歌词,必须征得许可。
但该Suno的主要争议在于,它是否利用受版权保护材料进行训练。OpenAI 因 ChatGPT 在其庞大的训练数据中使用书籍、新闻文章和其他受版权保护的材料而面临多起诉讼。有媒体要求 Suno 澄清这一点,但未得到答复。Suno 的创始人拒绝透露他们究竟将哪些数据塞入自己的模型,只透露了一点:它之所以能够生成令人信服的人类声音,部分原因是它除了从音乐中学习外,还从语音录音中学习。
Suno 表示,他们与各大唱片公司保持着沟通,并声称尊重艺术家和知识产权——他们的工具不允许你在提示中要求任何特定艺术家的风格,也不会使用真实艺术家的声音。
从创始人到员工中,许多人都是音乐家。公司的办公室里也摆放着钢琴和吉他,墙上挂着古典作曲家的照片。Suno并没有像当年Napster那样,表现出对音乐行业的公开敌意。但他们在做的事情,确实正在颠覆音乐行业的逻辑。
Suno创始人毫不掩饰自己的野心,他们想象着一个高度民主化的音乐世界。Mikey Shulman认为,目前音乐听众的数量远远超过音乐创作者的数量是“如此不平衡”,Suno 有望解决这种明显的不平衡。他的愿景是全球有10亿人每月支付10美元使用Suno创作歌曲。
Suno 最早的投资者之一是风险投资公司 Matrix 的合伙人Antonio Rodriguez。他认为 Suno 是一款功能强大且易于使用的乐器,并相信它可以将音乐创作带给每个人,就像照相手机和 Instagram 使摄影大众化一样。他和创始人甚至认为 Suno 可以吸引比 Spotify 更大的用户群。
获得新融资后,Mikey Shulman也宣布这笔钱将用来“打造人人都能创作音乐的未来”。对此,投资人表示全力支持,“所有伟大的公司都拥有优秀人才的组合,做些看似愚蠢的事,直到这事变得明显不愚蠢为止。”
到目前为止,Suno 用户似乎只热衷于将他们的歌曲分享给几个朋友,但也可以将它们上传到Spotify或 Apple Music 等平台。不排除一种可能,未来流媒体上充斥着AI生成的音乐。
AI会不会颠覆当下音乐行业的商业模式,一直是歌手、制作人和词曲作者热衷讨论的话题。但 Suno 的创始人声称没什么可担心的,“我们试图让10亿人比现在更多地参与音乐,如果人们更热衷于音乐,更专注于创作,培养出更独特的品味,这显然对艺术家来说是好事。我们对音乐未来的愿景是,它对艺术家友好。我们并不是想取代艺术家。”
但AI确实也在替代唱片行业中一些基础工作。ChatGPT可以帮助写词,Suno可以直接生成音乐,ACE可以帮助混音,甚至使用Mid journey、Runway、Sora可以帮助生成宣传图和MV。工业时代的音乐制作需要多个工种配合,也许以后只需要一个专业的人整体把关就足够。
尽管 Suno 只专注于吸引那些想创作歌曲以取乐的爱好者们,但在音乐行业人士的眼里,它仍可能造成重大破坏。像往常利润丰厚的广告配乐,未来是不是就都会由AI接手?
但对Suno来说,当下还有很多工作亟待完成。新的融资到账后,公司需要继续扩大规模,推出新的产品。在Mikey Shulman看来,还原已故歌手的声音这种操作不是人工智能未来的方向,他们考虑的是怎么把人们头脑中的想法变成现实,创作出原本不存在的作品。
也许等新技术连续落地后,现在的很多问题才会找到答案。
文章来源于“新音乐产业观察”,作者“益佰”