ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
从物理学到AIGC,Suno出现后做音乐还有前途吗?
4787点击    2024-04-03 10:43

震惊行业,到底什么是Suno?



Mikey Shulman,一位拥有哥伦比亚大学物理专业学位和哈佛大学物理学博士学位的才子,他的职业生涯原本应该在物理领域光彩夺目。然而,他却用另一种方式诠释了物理学的魅力,将理论知识运用到音乐创作中,成为了Suno AI的首席执行官和联合创始人。


令人惊讶的是,他在学术界的卓越成就并未妨碍他对音乐的热爱。在大学时期,他曾是乐队成员,从小便熟练掌握小提琴和吉他,是一位才华横溢的业务音乐人。他甚至还录制了自己的EP,充分展现了他个人在音乐领域的天赋。


在完成研究生学业后,Mikey Shulman进入了一家公司Kensho Technologies工作。这家公司后来被S&P Global 收购。在这份工作期间,他开始和团队成员探索音频AI的方向。 

Suno公司仅仅只有两年历史,公司联合创始人Shulman、Freyberg、Georg Kucsko和Martin Camacho都是机器学习专家,他们Kensho Technologies合作到2022年,这家公司专注于为复杂的商业问题寻找人工智能解决方案。


Shulman始终对音乐充满热情。例如,Shulman和Camacho都是音乐家,他们在Kensho工作期间就经常一起演奏。在Kensho,四人开发了一种转录技术,用于捕捉上市公司的财报电话,考虑到糟糕的音频质量、丰富的行话和各种口音,这是一项棘手的任务。


在这条路上,Shulman和他的同事们爱上了AI音频尚未探索的可能性。他说,在人工智能研究中,“一般来说,音频远远落后于图像和文本。我们从文本社区学到了很多东西,以及这些模型是如何工作和扩展的。”


同样的利益可能会把Suno的创始人带到一个完全不同的地方。尽管他们总是打算最终推出一款音乐产品,但他们最早的头脑风暴包括做助听器的想法,甚至通过音频分析找到故障机器的可能性。

他们开发的第一个版本是一个名为Bark的“文本到语音”程序。当他们调查早期的Bark用户时,很明显,他们渐渐发现其实真正想要的是一个音乐生成器。Shulman说:“所以我们开始进行一些初步的实验,它们看起来很有希望。”


这个大胆的想法最终演变成了Suno AI,一款强大的人工智能音乐工具。为实现这一目标,他与志同道合的伙伴们共同创立了Suno公司。在这个过程中,他们不断探索、实践,将物理学的严谨、音频AI技术与音乐的创新进行完美结合,为音乐创作带来前所未有的可能性。


Mikey Shulman今年37岁,他很疯狂,设想全世界有10亿人每月会愿意支付10美元与Suno一起创作歌曲。


他认为,目前音乐听众的数量远远超过音乐制作人,这一事实“太不平衡了”,他认为Suno准备解决这种不平衡的问题。Shulman强调,Suno致力于为用户提供独特而愉快的音乐制作体验,“我们希望每个人都能体验到制作音乐的乐趣”。


01 玩转AI生成与社交,Suno可能会比Spotify更大?


想象一个世界,无论你的音乐训练基础或演奏实力如何,创造一首优美歌曲的能力却触手可及。


Suno AI V3 Alpha音乐生成器是一款复杂的新工具,它正在改变人类对音乐创作的思考方式。这项先进的人工智能技术旨在帮助经验丰富的音乐家和热情的爱好者,简化了音乐生成过程,不仅在引发大量C端用户玩的同时,Suno的效率也在瞬间引爆了专业音乐人群。


现在,Suno AI在根据用户不断反馈改进模型,未来可能会吸引比Spotify更庞大的用户群。Shulman说:“我们的想法是,我们努力让10亿人比现在更多地参与到音乐中。”


目前,微软已经将Suno集成到其人工智能软件平台Copilot中。为了防止滥用和另一个“假Drake”,Suno表示,它已经已经开发了专有的、听不见的水印技术,可以检测歌曲是否是使用Suno创作的。


Suno的新音乐人工智能模型模糊了生成歌曲和人类创作歌曲之间的界限。


脸书和谷歌也凭借能够生成歌曲和声音的人工智能工具进入了这一领域。(回顾:谷歌发布音乐生成式AI模型MusicLM既令人印象深刻,又令人恐惧)


然而,能让Suno 在竞争中脱颖而出的一点是,它坚定不移地专注于创作以原创人声为特色的原创作品,这与克隆或模仿流行艺术家及其标志性声音的流行趋势不同。Suno用原创人声创作原创曲调,通过根据用户提供的描述生成歌曲来简化歌曲创作,社交分享功能可能会通过增强数字影响力来颠覆音乐行业,这也让它得以与竞争对手区分开来。


根据Suno AI的说法,按键、BPM以及根据提示混音和掌握歌曲仍然存在问题。V3 Alpha在歌曲结构上更具创造性,有时需要与V2不同的提示才能达到最佳效果。用户可以在测试阶段在V2和V3 Alpha之间切换,并获得300个免费积分进行实验。


的确,Suno V3的出现解决了大多数人缺乏演奏乐器或使用复杂音乐软件的能力这一事实,声乐在Suno的方法中发挥着关键作用,使其具备技术实力,打造一个真正的民主化音乐创作的平台。



02 不会取代职业艺术家?AIGC带来的机会与挑战


“我只是一个被困在这个电路中的灵魂。”


根据《滚石》杂志的一篇报道,唱这些歌词的声音是原始而悲伤的,夹杂着蓝色的音符。一把孤零零的原声吉他在它身后发出嘎嘎声,用优美的演奏点缀着声乐短语。但声音背后没有人,吉他上也没有人。


事实上,这里没有吉他。在15秒内,这首可信、甚至感人的蓝调歌曲是由Suno的AI模型自动生成的。从虚空中召唤它所需要的只是一个简单的文本提示:“关于一个悲伤的密西西比三角洲蓝调独奏。”


最准确地说,这首歌是两个人工智能模型合作的作品:Suno的模型自己创作所有音乐,同时调用OpenAI的ChatGPT生成歌词甚至歌名——《机器之魂》。到目前为止,大多数人工智能生成的艺术充其量都是媚俗的,就像超现实主义的科幻垃圾。


《滚石》杂志记者在报道中写道:Suno生成的这首《机器之魂》感觉有些不同——原文如下:这是我在任何媒介中遇到的最强大、最令人不安的人工智能创作。它的存在感觉就像是现实中的一个裂缝,既令人敬畏,又有点邪恶。我一直在想亚瑟·C·克拉克(Arthur C.Clarke)的一句话,这句话似乎是为AIGC时代而写的:“任何足够先进的技术都与魔法难以区分。”从剑桥回来几周后,我把这首歌送给了Living Colour吉他手弗农·里德(Vernon Reid),他一直直言不讳地谈论人工智能音乐的危险和可能性。他指出,他对这首歌“令人不安的逼真性”感到“惊讶、震惊、恐惧”。


仅在过去一年中,AIGC就在生成可信的文本、图像(通过Midtravel等服务)甚至视频方面取得了重大进展,尤其是使用OpenAI的新Sora工具。音频,尤其是音乐,已经落后了。但现在,Suno似乎已经破解了人工智能音乐的密码,公司创始人的野心几乎是无限的——他们想象着一个疯狂民主化的、人人都可以生成音乐的世界。


在创建Suno AI的过程中,Mikey Shulman和联合创始人经历了一段充满挑战和激情的旅程。他们凭借着对音乐的热爱和对人工智能技术的坚信,不断地优化和完善Suno AI。这条道路并非一帆风顺,他们在研发过程中遇到了很多困难,例如技术瓶颈、市场推广的挑战等。然而,这些都无法阻挡他们对Suno AI开发升级的执着和信心。在历经无数次的尝试和失败后,他们逐渐找到了人工智能与音乐创作的完美结合点,使Suno AI逐渐崭露头角,并在今年爆红出圈。


尽管Suno只专注于接触那些想创作有趣歌曲的乐迷,但它仍可能在这一过程中造成重大破坏。从短期来看,似乎最直接受到威胁的人类创作者市场是一个利润丰厚的市场——罐头音乐市场。从长期来看,Suno AI模型的进步会带来哪些新的变化还不清楚,但毫无疑问的是,Suno AI将会改变音乐产业的未来。



03 Suno的工作原理


Suno简化了歌曲创作过程。用户提供简短的歌曲描述,例如“一首关于人工智能疯狂炒作的时髦歌曲”。然后,Suno会生成两首不同的曲调,歌词不同,与描述相匹配。用户还可以通过创作自己的歌词和指定所需的风格来创作歌曲,无论是情感乡村民谣还是任何其他流派。此外,Suno还允许用户下载和分享他们的创作,从而形成一个充满活力的音乐社区,从工具到社区,这是Suno厉害的地方。


04 Suno AI的音乐制作功能


1、从文本到歌曲:用户可以输入自己的歌词或选择人工智能生成的歌词,展示了自然语言理解和创造力的显著提高。


2、多样化音乐风格的支持:它几乎支持每一种音乐风格,这表明在流派识别和改编方面有了巨大的改进,使其能够高度适应不同的音乐品味和要求。


3、器乐模式:一项新功能,允许在没有人声的情况下创建器乐曲目,扩展了Suno 工具在各种音乐作品和背景中的可用性。


4、自定义模式增强:以歌曲创作灵活性著称的自定义模式得到了进一步改进,为用户提供了对音乐生成过程的更多控制和精度。


5、多样化的流派改编:展示了生成从迷幻摇滚到乡村等多种流派音乐的能力,更展示了其自适应算法的广度。


6、提高了连贯性和音频质量:尽管出现了一些小故障,但歌词的连贯性和整体音频质量都有了明显的提高,这表明人工智能的处理和生成算法得到了增强。


7、创造性的提示处理:能够处理和创造性地解释一系列独特而富有挑战性的提示,从细胞组件之间的说唱大战到关于虚构场景的歌曲,这表明Suno V3对上下文和创造力有着强大的理解能力。



05 避免侵权


Suno的核心原则之一是合法和合乎道德地制作音乐。Suno表示,它正在与各大唱片公司进行沟通,并表示尊重艺术家和知识产权——它的工具不允许你在提示中要求任何特定艺术家的风格,也不能使用真正艺术家的声音。


模型始终“屏蔽”在歌曲请求中使用特定艺术家的名字,确保不会发生侵犯版权的行为。试图生成具有特定艺术家参考的歌曲的用户还会收到一条信息,强调Suno对原创音乐生成的承诺。


此外,Suno还禁止用户从外部来源上传受版权保护的音乐样本和歌词。


06 免费与订阅的选择


Suno提供分层定价结构,以满足不同的用户需求。


目前在Suno AI网站上,注册新账号每天可获50个积分,免费版权共可用于10次生成歌曲(50 credits renew daily /10 songs),随后要继续使用就要充值,1个月内生成500首歌曲需要8美元,每个月内生成2000首歌需要24美元。


Suno还提供年度订阅折扣,使广大音乐爱好者可以使用它。


07 Suno团队是谁?


Suno背后的创始团队包括首席执行官Mikey Shulman和他的联合创始人:Georg Kucsko、Martin Camacho和Keenan Freyberg。


这四位才华横溢的人之前曾在Kensho合作,Kensho是一家专门从事金融数据的人工智能科技初创公司,后来被标普全球收购。Suno团队目前由10名成员组成,正在积极扩张,并获得强大的资本支持。


08 Suno的技术


Suno使用与ChatGPT等大型语言模型相同的通用方法,将人类语言分解为称为标记的离散片段,吸收其数百万种用法、风格和结构,然后按需重建。但音频,尤其是音乐,几乎更为复杂。CEO Shulman说:“音频不像文字那样是一个离散的东西。这是一个波,这是一种连续的信号。”


高质量音频的采样率通常为44khz或48hz,这意味着“每秒48000个代币”。这是一个大问题,Suno做了很多工作,做了很多探索启发尝试,还有很多其他类型的技巧和模型等。最终,Suno希望找到文本到音乐界面的替代方案,添加更先进、更直观的输入——根据用户自己的歌声生成歌曲是一个想法。


不过,Suno的创始人团队拒绝透露他们正在向自己的模型中挖掘哪些数据的细节,除了它产生令人信服的人声的能力部分是因为它除了从音乐中学习之外,还从语音记录中学习。


09 Suno面临的挑战和发展潜力


考虑到从语音和个人音符到编排和流程等众多组成部分,用人工智能创作令人信服的音乐是一项艰巨的挑战。此外,缺乏高质量的数据来训练人工智能模型,根据描述来解释音乐风格和情绪,这仍然是一个障碍。


总的来说,Suno生成歌曲的创新方法和强大的社交分享功能,都有望彻底改变音乐行业的生态。


对于Suno的爆火,你怎么看呢?


本文来自微信公众号“音乐财经”,作者:小鹿角编辑部