今年2月,日本小说家九段理江使用ChatGPT协同创作的小说《东京都同情塔》获得日本的芥川文学奖。
她获奖后坦言,AI是其小说灵感来源,并且5%左右的文字直接取自生成式人工智能,这一言论引发不小争议。
一些人对人工智能持欢迎态度,视之为新的写作工具;也有人心存疑虑,担心它影响作者创造力。
创造力是技术创新的驱动力,也是人类通过文学、艺术和音乐进行表达的基础。
然而,生成式人工智能技术的出现,正在挑战人类创意生产的独特性和优越性。
虽然AI已被证明可以提高工作生产质量和效率、加快编程任务等,但人们对生成式人工智能对人类基本行为的潜在影响知之甚少,比如人类的创造能力。
AI介入创造力领域是促进了创意迸发还是导致思维惰性?与AI同行的时代,人类的舞台是更广阔了,还是不得不与其分席而坐,划疆而治?
最近,UCL和埃克塞特大学的两位学者在Science上发表了一项研究成果,或许能给这一话题带来启示。
论文地址:https://www.science.org/doi/10.1126/sciadv.adn5290
实验过程:与GPT共谱八行小说
这项研究主要关注OpenAI的GPT模型对受试者生成原创性和创造性写作内容能力的影响。
500名参与者在不同的人工智能生成创意的帮助下,让他们就随机分配的主题撰写大约8行的故事,并对故事的目标受众进行了说明。
实验发现,获得AI想法会使故事更有创造力、写得更好、更具可读性。
然而,与人类单独创作的故事相比,由AI生成的故事之间的相似度更高。
这些结果表明,在提高个人创造力的同时,人类集体中创作的新颖性也有可能丧失。
创造力通常从两个维度进行评估:新颖性和实用性。
新颖性评估的是一个作品构思或者选材的新鲜罕见,超出常规。
在研究中,根据以往的文献,新颖性指数反映了故事的新颖性、原创性和稀有性。
实用性反映了一个创意的可用性和相关性,我们可以将其理解为,这个短篇故事经过进一步发展后,成为出版产品的可能性。
因此,研究对实用性指数进行划定,以反映故事对目标受众的适宜性、发展成一整本书的可行性以及出版商出版该书的可能性。
在这种情况下,AI至少会从两个方面影响创意写作。
一方面,人工智能生成的创意可以作为人类思维的「跳板」,提供思维起点,帮助作家克服拿到选题头脑一片空白的情况。
如果是这样的话,AI能促进写作效率并且能为作家带来更具创造性的写作成果。
另一方面,人工智能也可能会阻碍创作。
一开始就将作者思维束缚在在一个特定的想法上,影响了思维的发散。
此外,AI提供的输出可能基于大数据的衍生物,因此无法为新的创造性想法提供肥沃的土壤。
如果是这种情况,实验预计AI会导致更多雷同的故事。
实验主要分为两个阶段:写作内容和评估结果。
研究的第一阶段招募了293名参与者,要求他们写一个适合青少年读者的8句话短篇故事。
参与者被随机分配到三种条件之一:只有人类写作、人类与一个GenAI以及人类与五个GenAI。
实验设计示意图
第一组写作者被分配了任务,没有提及或接触到生成式人工智能。
第二组中的写作者可以选择调用GPT-4来提供三句话的起始构思,以激发他们的故事写作灵感。
第三组作家可以选择接受最多5个GenAI想法,每个想法都可能为他们的故事提供不同的灵感。
在完成故事后,作者需要对故事的新颖性、实用性和一些情感特征进行自我评价。
在第二阶段,由600名参与者组成的另一个小组对作者创作的故事进行评估。
实验总共收集了293个故事,然后交给评估人员。
每名评估者随机阅读了6个故事,但并不知晓这些故事是否有AI参与写作。
所有故事均由多名评估者对其新颖性、实用性和情感特征进行评估,这些构成了主要研究问题的关键结果变量。
其次,评估者被要求评估故事由人工智能编写的可能性有多大。
最后,评估者会被告知作者是否使用AI创作,然后就每个故事的作者的所有权做出回答。
实验还就以下问题征求了评估者的一般意见——
创作过程中使用人工智能在多大程度上符合道德规范?人工智能创作者与人类创作者之间应如何分享故事所有权和假设利润?
实验结果
实验设置了两组对照组,有纯人类与人类加GenAI的对照组,也有不同数量GenAI的对照组。
实验发现,人工智能生成辅助工具可以提高故事的新颖性和实用性。
为了更好地理解更多的人工智能生成想法如何影响创造力的提高,第二组对照组就清晰的讨论了这一问题。
第二组中,88.4%的参与者选择至少一次调用生成式人工智能来提供最初的故事创意。
在1个GenAI创意的条件下,100位作者中有82位选择了生成一个创意。
而5个GenAI创意的条件下,98位作者中93位选择了生成一个创意。当参与者选择可以不止一次调用人工智能生成器时,他们平均调用了2.55次,其中24.5%的人最多调用了5次。
实验结果显示,获得1个AI想法会在一定程度上提高创造力,但获得5个AI想法的作家的创造力提高幅度最大。
在新颖性方面,在1个GenAI创意的条件下,新颖性比没有获得AI辅助的作家提高了5.4% ,而在5个GenAI创意的条件下,新颖性比没有获得AI辅助的作家提高了8.1% 。
第三方评估者对创造力和情感特征的评估
另一个评估维度实用性的结果更为显著。获得1个GenAI创意的作家的故事有用性比没有AI辅助的作家高出3.7%。
与没有AI辅助的作家相比,获得最多5个GenAI的作家的有用性提高了9.0% ,与获得获得1个GenAI创意的作家相比,有用性提高了5.1%。
总体结果表明,获得更多的人工智能辅助会带来更有创意的故事。
结果分析1:情感特征
接下来,实验将衡量评价者对故事的情感偏好,包括故事的写作水平、令人愉快的程度、有趣程度、无聊程度以及故事情节曲折的程度。
研究人员还询问评价者,读完后是否有「求更新」的心理,即根据文学理论家Robert Jauss的概念,更新颖的文学作品会激发读者对后续故事的期待。
实验发现,能够获得AI想法的作家所写的故事更令人愉快,而且更有可能出现情节转折。
到目前为止,实验关注的是第三方读者的主观评价,现在我们转向对故事内容进行更客观的衡量。
使用OpenAI提供的模型API获得的文本变慢,研究人员计算了当前故事与条件内所有其他故事的余弦相似度。
将余弦相似度分数乘以100,得到一个范围从0到100的指数,能够反映两个故事的语义相似度。
结果表明,获得生成式AI的想法可以使当前的创作与相同条件下其他故事的平均值更加相似。
为了理解为什么受到AI启发的故事看起来更加相似,实验将故事文本编码的余弦相似度与GenAI提出想法的余弦相似度进行比较。
具有1种GenAI想法和具有5种GenAI想法的作者,撰写故事的相似度分别为 5.2%和5.0% , 分别与GenAI的想法更相似。
简而言之,两种有GenAI帮助的作家在某种程度上都依赖于AI辅助给他们的创意。
实验启示和反思
首先,使用AI可以有效提高读者对故事的评价,因此特别有利于写作能力较差的作家。
这也与最近其他领域的研究结论一致。其他领域的研究者也发现,GenAI可以帮助生产力较低的工人。
其次,人们可能会问,AI的辅助是否可以帮助人类突破创造力上限,让作家们达到原本无法攀登的高度?
遗憾的是,本研究并没有找到能支持这种可能性的证据。
最后,评估人员们对AI辅助创作的相关道德、理念问题究竟持何种观点?
收益方面,评估人员认为,作家如果使用了AI的创意理念,应该至少将作品收入的25%分给GPT。
大多数评估人员还表示,如果作者使用了AI进行辅助写作,应该尊重读者的知情权,主动披露相关内容。
但总体而言,大多数评估人员认为使用人工智能撰写故事是合乎道德的,即使借用了创意和文字,这种写作依旧属于「创造性行为」。
这些结果表明,人们支持在创意作品中使用AI作为辅助工具提供创意,但对所有权有限制,并要求披露使用情况。
整体研究也存在着一些局限性。例如,写作任务的长度不足(即八个句子)、媒介(即写作)和输出类型(即短篇小说)受到限制,并且与LLM没有交互性。
这些研究方法不足也让我们无法得出更加具有普遍意义的结论,相关结果可能无法推广到其他创作领域。
比如,不同媒体(例如图像或音乐)中AI想法可能会以不同的方式融入其中,从而产生不同的效果。
此外,未来更加专业细化的实验可以要求参与者通过与AI交互来解决特定问题,例如为特定市场或目标受众提出新颖实用的产品创意。
总之,以上实验已足够得出结论:虽然结果表明个人创造力有所提高,但存在失去集体新颖性的风险。
一个有趣的问题是,如果出版行业接受更多受GenAI启发的作品,根据这份研究结果,所创作的故事在总体上将变得不那么独特,彼此之间将变得更加相似。
这也会产生新的恶性循环:如果个别作家发现受AI启发后的作品被评价为更有创意,他们就会有动力在未来更多地使用人工智能,但这样做可能会进一步降低作家们的集体创新性。
简而言之,尽管AI对个人创造力有增强作用,但如果AI被更广泛地用于创造性任务,对于集体创作来讲不一定是好事。
文章来源于“新智元”,作者“新智元”