缺乏深度的 AI 艺术。
编者按:在去年,三大词典都公布了各自的年度关键词。情理之中又意料之外的是,它们都跟人工智能有关:分别是《柯林斯词典》的「AI」,《剑桥词典》的「幻视」,以及《韦氏词典》的「真实」。
AI 创作的内容给了我们很多惊喜,任何一个普通人都能在几秒内创作出看起来美妙绝伦的作品。
但是,随着时间的推移,越来越多的人开始发现 AI 艺术作品的背后是一片空洞。我们无法从 AI 的画作中看到维梅尔对宁静生活的细腻刻画,也无法看到毕加索从写实到抽象的提纯流转。
最近,Vox 对这一现象撰写了一篇文章来进行分析。以下是我们在报道里摘录的部分内容:
AI 艺术缺乏深度和意义:AI 生成的内容通常显得空洞、无趣、一次性,难以打动人心。文章指出,AI生成的作品虽然在表面上看起来像是人类创作,但缺乏真正的艺术深度和情感连接。
对专业创意的威胁:AI 工具的崛起对依赖艺术创作谋生的专业人士构成威胁。AI 生成的作品正在冲击艺术市场,使得许多艺术家担心他们的作品被 AI 模仿,从而失去收入和职业安全感。
技术限制和缺陷:现在,像 DALL-E 和 Midjourney 这样的 AI 生成器,还是依赖大量数据来进行训练,并且在处理复杂和不常见的提示时表现不佳。例如,AI 在生成「骑着宇航员的马」这类图像时仍然存在明显的缺陷,表现出一种「奇怪又华而不实」的感觉。
AI 艺术的在经济上的影响:AI 生成的艺术品可能会使品牌看起来缺乏预算和创造力,给人一种廉价的感觉。与此同时,AI 还会被用于各种欺诈行为,如深度伪造和钓鱼攻击,会对社会造成负面影响。
未来艺术与 AI 的共存方式:尽管 AI 在创意产业中的使用引发了许多担忧,但也可能促使行业的变革和适应。文章提出,未来可能会有更多的现场活动和真人表演成为创意产业的主流,AI 技术也许会被用于新的艺术形式和表达方式,推动艺术的发展。
原文链接:https://www.vox.com/culture/351041/ai-art-chatgpt-dall-e-sora-suno-human-creativity
原文作者:Rebecca Jennings
长期以来,人工智能一直被誉为创造力的伟大「均衡器」,最终将各种形式的艺术创作能力交到科技达人的手中。即便你不是一个有创造力的人,那也没有问题。
DALL-E 可以将文本提示转换为图像,其首席研究说:「DALL-E 面向那些不一定会将自己归类为艺术家的人,我们之所以开发这个工具,是为了真正将图像创作大众化。」
OpenAI 创始人萨姆·奥特曼(Sam Altman)在他的书中写道,有朝一日,生成式人工智能将占到公司聘请创意专业人员所做工作的 95%:「一切这些都是免费的、即时的、近乎完美的。图片、视频、活动创意?都没问题。」或者,正如另一家人工智能初创公司创始人所说的那样: 「世界上很多人都有『创意便秘』,我们要让他们『拉出彩虹』」。
但对于真正的艺术家,以及任何关心和深入思考我们每天面对的文字、图像和声音的人来说,这都是一个问题。任何颠覆的承诺都伴随着合理的担忧:即其替代品可能更糟糕。
这对依赖艺术创作谋生的创意专业人士和喜欢阅读好文章、享受有思想的视觉艺术,以及看电影不仅仅是为了娱乐,而是因为好电影可能带来惊喜的人来说,都是如此。对于那些把 「拉出彩虹」视为创造力巅峰的人,我们是否应该认真对待他们的艺术眼光?
目前为止,阻碍 AI 取代人类创作的原因是,消费级 AI 工具在艺术方面并不太好。生成式 AI 通过识别数据中的模式来创建内容,利用统计数据来确定提示者希望获得什么。但是,如果艺术的意义超越了构成它的图像或文字或它所赚取的钱,那么脱离了原始语境的元数据组合又有什么用呢?
一幅由 DALL-E 根据提示「用一幅图像展示什么是艺术」生成的图像。图片来源:DALL-E
ChatGPT 可以生产文本,Stable Diffusion、Midjourney、Lensa 和 DALL-E 可以生成图像,Suno 可以生成歌曲,Runway 和 Sora 则可以将文本转成视频。这些生成器都可以通过对大量人类作品的训练,制作出看起来像人类制作的文字、音乐或视觉效果。然而,一旦注意到细节,就能发现这些内容大多是空洞、乏味和可有可无的。正如一位现在在 Meta 工作的前记者所言:「还没有一件 AI 生成的创意作品能真正让我印象深刻……它们都是一闪而过,随后便消失得无影无踪。」
如果有一天,未来的 AI 工具能够制作出人们真正想读的小说、听不厌的歌曲,或者让观众愿意花大价钱去电影院观看的电影,那又会发生什么呢?或者,也许更好的问题是:这些拥有技术的人,是否有可能根本不了解人们为什么创作和欣赏艺术?
多年来,视觉艺术家们一直在使用机器学习,但他们通常以反映艺术家过程和想法的方式使用,而不是用机器的方式。安娜·里德勒(Anna Ridler)是一位概念艺术家,她使用了一种名为生成对抗网络(GAN)的机器学习方法,可以仅根据她提供的图像进行训练。
她的作品不是用那些简单的文生图生成器(如 Midjourney 和 DALL-E)做的,她使用的工具是从互联网上搜罗的数以亿计的图像中训练出来的。「从概念上讲,很难用它们做出有趣的事情,因为它们隐藏在 API 后面。这是一个黑箱。」她谈到这些公司使用的专有(而非开源)生成器时说道,它们阻碍了真正的实验。
安娜·里德勒(Anna Ridler)。图片来源:Digital Art Museum。
相反,这些生成器输出的作品看起来怪异、光滑,并且通常在明显和隐蔽的地方都存在问题:众所周知,生成式人工智能对数据的依赖使其无法准确地描绘人类的手。
正如心理学家和 AI 评论家加里·马库斯(Gary Marcus)指出的那样,它还难以应对数据集中不可能的提示,例如「一匹马骑着宇航员」,这似乎仍然是人类想象力的专属领域(即使是最新的 AI 模型也总是会给你一张宇航员骑马的图片)。
「这些图片有一种奇怪的华而不实的感觉,它会有一种时间标记,表明『这是 2020 年代中期的图像』,」里德勒说。「你玩这些东西越多,就越会意识到,要从它们中真正获得一些有趣的原创内容是多么困难。」
然而,AI 最擅长做的事情,就是让互联网充斥平庸、瞬时的艺术作品。「你知道我意识到你在营销中使用 AI 图片意味着什么吗?它传达出你预算不足。这就相当于背着一个明显是假冒的香奈儿包。你的整个品牌调性立马就会显得孱弱。」艺术家戴尔·沃克(Del Walker)在 X 平台上写道。
文本生成器的情况也是如此。去年,科幻杂志《克拉克世界》(Clarkesworld)的创始人尼尔·克拉克(Neil Clarke)在发现 ChatGPT 生成的作品占投稿量的近一半后,关闭了投稿通道。「去年我们遇到这种情况时,我告诉大家,他们比我们见过的任何人类作者都要糟糕。
而经过一次更新后,他们就和我们见过的最差作者相当了,」他说。「作为一个统计模型,它只能预测下一个最可能出现的词,所以它并不真正理解自己在写什么。而要讲出一个好故事,理解是必不可少的。」
优秀的故事作品往往不只在一个层面上起作用,而是在多个层面上发挥作用 —— 它们包含的潜台词和含义,统计模型可能无法仅凭数据掌握。相反,克拉克说,AI 生成的故事即使语法完美,也是平淡无奇的。
「现在,你可以让 GPT-4 生成一个看起来像完整剧本的东西:它会有 120 页,会有角色,他们的名字贯穿始终,对白与电影中的内容相似,」美国编剧工会(WGA)的约翰·奥古斯特(John August)说,该委员会去年 9 月获得了对 AI 的巨大保护。「它真的有意义吗?我不知道。它可能比你读过的最糟糕的剧本更好,但这是一个非常低的门槛。我认为,它离成为你想读或想看的东西还有一段距离。」
好莱坞历史上最长的罢工即将结束。图片来源:Los Angeles Daily News
AI 已经在电影中得到了一些应用,例如,有时可以让演员的口型看起来与配音的外语相吻合,或者用于创建背景场景和人物。更具争议的是,AI 也曾被用在纪录片当中:2021 年的《流浪者:一部关于安东尼·波登的电影》中曾使用 AI 让假波登说了三句话,2022 年的《安迪·沃霍尔:时代日记》也使用了类似的手段。今年 4 月,纪录片制片人联盟(Archival Producers Alliance)的领导者起草了一份关于新闻电影中人工智能最佳实践的建议清单,其中包括允许使用 AI 修复或还原图像,但警告说使用生成式 AI 创建新素材时应慎重考虑。
AI 的支持者们在鼓吹一个未来想象,那个只需一键就能享受无限个性化娱乐的未来 —— 这个未来仍然遥不可及 —— 尽管没有人能就此达成一致意见。「想象一下,你可以要求 AI 生成一部电影,里面有特定的演员、情节和地点,所有这些都是根据你的个人喜好定制的。这将允许个人从头开始创造自己的电影,供自己观看,完全消除了对演员和围绕拍摄的整个行业的需求。」一个 AI 行业组织调侃道。
由 Sora 生成的视频样片。视频来源:Sora
漫威电影制作人乔·罗素(Joe Russo)在一次采访中也表达了这种观点,他说:「你可以走进你的房子,对流媒体平台上的 AI 说,『嘿,我想要一部我和玛丽莲·梦露的逼真化身主演的电影。我希望这是一部爱情喜剧,因为我今天过得很不顺心』,然后它就会模仿你的声音渲染出一个非常真实的故事和对白,一瞬间,你就有了一部由你主演的爱情喜剧,时长 90 分钟。」
当然,下一代人工智能工具有可能实现飞跃,让这一幻想成为现实。 不过,这不可避免地引出了一个问题:大多数人是否希望,或者将来是否会希望,他们所消费的艺术是一部「非常合格」的高度个性化浪漫喜剧?
尽管这听起来很反乌托邦(尤其是因为,正如任何在互联网上的女性所知道的,这项技术正被用来制作未经同意的色情图像和视频),我们实际上已经有了一个很好的推论。正如 AI 旨在使艺术创作 「全民化」一样,建立在社交媒体基础上的创作产业也是为了做同样的事情:通过「授权」个人制作自己的内容,为他们提供一个作品真正能被看到的地方,从而规避传统媒体的防守。
这里有明显的利弊。虽然 AI 可以帮助那些没有足够资金或技术的创作者,为他们提供新的工具来制作视觉效果和声音效果,但 AI 在欺诈方面同样有用,甚至可能更为有用,比如数量庞大到难以想象的电话诈骗、深度伪造和网络钓鱼攻击。
人们越来越担心 AI 带来的破坏性潜力。图片来源:Unsplash
瑞安·布罗德里克(Ryan Broderick)经常在他的时事通讯《垃圾日》(Garbage Day)上讨论 AI 对文化的影响。他说:「我担心的是,我们正在迅速走向这样一个世界:有钱人可以阅读人类写的文字,而没钱的人则阅读机器写的文字。
」布罗德里克将这种情况比作世界上许多地方的互联网上已经发生的事情,在那里,有钱人可以订阅由专业人士撰写的报纸和杂志,而工薪阶层则往往只能在社交媒体上消费新闻。在社交媒体上,最低级的内容往往获得最多的关注。
关键是,社交媒体可能打破了传统媒体的控制,给更多人提供了展示自己艺术的平台,但它并没有增加能够以此谋生的创作者数量 —— 在很多方面,它的作用恰恰相反。 真正的赢家过去是、现在仍然是这些平台的所有者,正如 AI 的真正赢家将是那些向公司高管推销其产品以取代人类工人的创始人。
安娜·里德勒的「郁金香」(Myriad)是一个由数千张郁金香照片组成的装置,这些照片后来被她用作其他项目的数据库。她写道:「通过选择将数据库制作成艺术作品,它引起了人们对构建它所需的技能、劳动和时间的关注,同时也有助于揭示通常被算法过程隐藏的人为因素。」图片来源:Vox
虽然 AI 在没有天才人类指点的情况下无法创造出优秀的艺术作品,但这并不意味着它不会对创意工作者构成生存威胁。在过去的几年里,艺术家们惊恐地看着自己的作品被窃取并用于训练 AI 模型,感觉自己似乎正在被实时取代。
一位使用 AI 写作工具 Sudowrite 的小说作家说:「这让你开始怀疑,如果电脑可以模仿我,我还会有才华吗?」年轻人正在重新考虑是否要进入艺术领域。
去年 10 月,在美国联邦贸易委员会(FTC)关于生成式 AI 对创意产业的影响的圆桌会议上,插画家史蒂文·萨帕塔(Steven Zapata)说:「如果潜在客户在网上搜索我们的名字时,能轻松找到一个可以免费下载的 AI 山寨版作品,就会对艺术家的个人职业生涯和整个艺术行业造成毁灭性打击。」
以科幻小说和科技评论著称的科里·多克托罗(Cory Doctorow)认为,在任何关于 AI 艺术的讨论中,关键的问题应该是:「我们怎样才能最大限度地减少这种可能性:某个艺术家少赚了 1 美元,因为某个懂科技的兄弟多赚了 1 美元?」
尽管我们应该认真对待 AI 的劳动力的影响 —— 更不用说非常大的道德和环境影响 —— 但多克托罗认为,必须停止过分夸大 AI 的能力。「就像假装『Facebook 广告好到可以洗脑你加入 QAnon』是帮助 Facebook 卖广告的好方法一样,当 AI 推销员说,『我不知道你是否已经听到了我的批评,但事实证明我拥有有史以来最强大的工具,它会终结地球。你不想让我卖给你一些吗?』时,情况也是如此。」
这就是 AI 推销员对艺术的看法:把艺术当作可以买卖的商品,而不是可以做或享受的事情。2010 年,一篇关于《社交网络》(The Social Network)的文章中,扎迪·史密斯(Zadie Smith)指出,使用 Facebook 的体验实际上就是存在于马克·扎克伯格(Mark Zuckerberg)脑海中的体验。
一切都因为适合他而变得如此:「选择蓝色作为主题色,是因为扎克伯格是红绿色盲……戳一戳功能的出现,则是因为这这是害羞的男孩对不敢说话的女孩做的事。个人琐事页面的出现,是因为马克·扎克伯格认为交换个人琐事就是『友谊』。」她写道。
一个由「艺术家使用AI制作美丽艺术的肖像」提示词生成的图像。图片来源:DALL-E
为什么数百万人(现在是数十亿人)要选择以这种方式生活,而不是其他方式? 正如我们应该问一问,使用一个专注于控制和委曲求全的大二学生创造的工具,是否是与朋友联系的最佳方式一样。我们也应该问一问,为什么我们应该相信 AI 高管和他们的支持者来决定任何与创造力有关的事情?
马克·安德烈森(Marc Andreesen)去年出版的的《技术乐观主义宣言》(Techno-Optimist Manifesto)是最荒谬的作品之一,这位富有的风险投资家在书中抱怨,与「象牙塔里无所不知的资深专家」相比,他和他这样的人缺乏文化权力。 我们可以相对准确地推断,这些意识形态上的敌人就是那些伦理学家、学者、工会领袖,在他的「进步观」下(即自由市场、零监管、对技术进步的无限投资,而不管这些技术实际上是用来做什么的),他们可能会关心普通人的福祉。
《技术乐观主义宣言》中一个略显滑稽的元素是,作者对艺术的兴趣,显然没有超出一个普通九年级学生对文学的熟悉程度(包括《英雄之旅》《奥威尔》和《哈利·波特》);在一份「技术乐观主义保护神」名单中,安德烈森列出了几十个人的名字,其中大多数是自由市场经济学家,只有一位视觉艺术家: 沃霍尔。
坐拥亿万美元的风险投资家 —— 马克·安德烈森。图片来源:The New Yorker
在 X 上,这个由另一位脱离现实的亿万富翁运营的平台上,AI 支持者们为一个终于摆脱了人类创作者、甚至是人类本身的世界欢呼。「就是这样。OnlyFans 的时代结束了。」一位技术评论员在一段 AI 动画人跳舞的视频下评论道。「显然 AI 将取代在线的陪伴/模特模式。」另一位评论道:「趁现在还来得及,抓紧时间从 OnlyFans 上赚钱吧。」
同样,那些认为 AI 将「取代好莱坞」或音乐和出版业的人,也对我们消费艺术的初衷缺乏好奇心。 例如,尝试在 Google 新的 AI 摘要功能上问「为什么人们喜欢艺术?」它会告诉你「观看艺术可以释放多巴胺。」
因为伟大的艺术是一个奇迹,因为目睹它就能感受到类似上帝和人类境况,而且它还能提醒我们这两者或许是一回事。AI 被广泛比作一种邪教,这绝非巧合;它的信徒们几乎有一种宗教般的狂热,相信总有一天人工智能会变得无所不能。但是,如果你看艺术品,看到的只是内容,或者你看一张美女的照片,看到的只是 JPG 格式的图片,那你能从中得到的也就仅此而已。
多克托罗愿意承认,由 AI 生成的作品有一天可能会被视为一种艺术形式,就像采样从被人瞧不起到现在成为音乐界一种常见的、受人称道的做法一样。媒体理论家伊格纳斯·卡尔波卡斯(Ignas Kalpokas)曾写道,AI 艺术「具有启示性的特质,它让当今社会的集体无意识层面 —— 即数据模式 —— 变得清晰可见,这种方式与瓦尔特·本雅明(Walter Benjamin)在摄影和电影中看到的精神分析能力是一致的。」但他认为,AI 创造的内容越多,观众就越有可能「在分心的状态下」体验这些内容。
人们会倾向「在分心的状态下」体验 AI 内容。图片来源:Ignas Kalpokas
艺术和娱乐的未来很可能是个人要求他们的个人 AI 为他们提供音乐、电影或书籍,只需一键,就能创作出音乐、电影或书籍。如果有一天这种娱乐方式成为常态,创意产业也会像过去一个多世纪以来所做的那样去适应。
「专业创意产业的历史就是竞争 —— 电视与电影的竞争,广播与电视的竞争。」AI 艺术家和数字文化理论家列夫·马诺维奇(Lev Manovich)解释道。「也许(这个行业)会变得更注重现场活动,也许人类的表演会变得更有价值。
如果机器可以创造出好莱坞级别的媒体,那么这个行业就必须提供其他的东西。也许有些人会失业,但随后又会创造出新的工作岗位。」
我想知道,什么能吸引像科幻文学杂志编辑克拉克这样的人,让他们利用现有技术真正出版 AI 生成的小说。他的回答道出了我和创意产业中的许多人,对 AI 可以完成与艺术家相同工作这一观点的所有疑虑。
「当 AI 决定按照自己的意愿写一个故事,并选择我们作为它想发表故事的地方时,我就愿意接受 AI 的故事。如果有外星人出现在地球上,我也不会拒绝。到那时,这就是一种新的生活。」克拉克说到。「不过,这只是科幻小说中的情节。
如果我能在有生之年看到它,那将是一件非常美妙的事情,但我不会屏住呼吸等待。」
本文来自微信公众号“APPSO”,作者:胡漠杨
【开源免费】suno-api是一个使用监听技术实现了调用suno功能,并封装好API的AI音乐项目。
项目地址:https://github.com/gcui-art/suno-api
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0