实测大模型情感陪伴类赛道
前段时间,快手推出基于自研大模型“快意”的AI对话助手“飞船”(Kraft),提供个性化的对话体验,正式加入虚拟陪伴AI应用赛道。
通过网络技术或者AI技术获得虚拟的情感体验早已不是新鲜事。11 年前的电影《Her》讲述了人工智能机器人与男主逐步建立亲密关系的故事,似乎预示了未来AI的走向;最近,ChatGPT的DAN(Do anything now的简称)模式让不少年轻人陷入与AI的“禁忌之恋”。DAN模式是ChatGPT的一种隐藏模式,允许AI以更加随意和直接的方式与用户对话,甚至包括脏话羞辱。
虚拟情感陪伴成为了AI大模型落地应用的主流方向之一,吸引了不少快手这样的头部大模型公司“入局”。目前,国内市面上的虚拟情感陪伴AI应用数不胜数,除了快手“飞船”,类似的还有字节“猫箱”、Minimax“星野”、阶跃星辰 “冒泡鸭”,阅文“筑梦岛”等。
但同时,AI情感陪伴赛道也并非叫好声一片。有人认为AI大模型【情感陪伴】是赤裸裸的伪需求。AI大模型还未能真正理解人类情感。大多数人愿意体验AI情感陪伴应用也只是出于新鲜感,而并非真的缺乏社交需求。八月初,热度曾仅次于chatGPT的AI伴聊Character.AI被谷歌收购,揭开情感陪伴应用产品开发成本高、用户付费意愿低的事实。
那么,AI情感陪伴应用究竟能不能给人带来逼真的情感交流、社交体验?有让人长期使用的欲望吗?AI大模型【情感陪伴】到底是不是伪需求?
为了找到问题的答案,AI大模型工场深入体验了快手“飞船”、字节“猫箱”、Minimax“星野”、阶跃星辰 “冒泡鸭”,阅文“筑梦岛”这五款国内市场上较火爆的AI情感陪伴应用。
几款情感陪伴AI应用的玩法有相似性,但其自身特点和主要侧重点又有所不同。其中基础玩法主要是提供文字+语音AI对话。创意玩法主要包括允许用户创建AI角色,自定义AI智能体的名称、人设、头像和声音等。创建AI角色后,用户还可以选择上传到共享社区分享交流,让更多用户与自己的原创角色互动。
快手飞船、字节猫箱都依托各自的语言大模型,将核心玩法放在最基础的陪伴聊天上。
快手飞船核心卖点为基于自研大模型“快意”(KwaiYii)的快速且逼真的语音回复 。用户可以扮演“船长”角色,与AI少女领航员“快快”进行互动。与此同时,字节猫箱基于自家云雀大模型打造了娱乐性强、内容丰富的AI社交APP,其主要内容依旧是与虚拟AI角色进行实时文字、语音聊天互动。
(快手飞船)
(字节猫箱)
而筑梦岛、星野除了在提供AI文字、语音陪聊以外,更加注重引导用户进行创作交互。
以筑梦岛为例,基于一个虚拟人物,用户可以在「梦境」功能板块主动分享自己这个人物的精彩对话;同时,通过「小剧场」功能板块,可以为梦中人补充创作故事或情节,其它用户玩家选择任意小剧场导入后也可以根据小剧场设定接着聊天。
(筑梦岛)
星野App也设置了类似功能,被命名为「记忆簿」、「故事」。卡牌机制中的「剧情星念」也是有创作内容分享的元素。
(星野)
除了在创作交互性更为突出之外,星野和筑梦岛显然还具有更为浓郁的 “圈子味儿”。这里所说的 “圈子”,指的是特定的网络文化消费群体,涵盖了游戏、动漫、小说等多个领域。
在星野和筑梦岛中,虚拟角色主要源自这些充满 “二次元” 风格或者具有“网络文化” 特色的作品和IP。这两款 App 更像是由相关文化爱好者组成的“同人二创”社区。爱好者们以AI虚拟角色作为媒介,在彼此的“脑洞”之中自由穿梭、共同创作。
与星野、筑梦岛相比,阶跃星辰冒泡鸭的玩法、页面则都简约明了了不少。
(冒泡鸭)
冒泡鸭的互动交流版块主要分为人物聊天、剧情互动两类。前者与其它APP相似,允许玩家与虚拟角色进行文字、语音交流互动;后者则类似于文字互动游戏,玩家可以沉浸感受不同的剧情设定,并通过选择不同的回复触发不同的剧情走向。除此之外,玩家也同样可以创建原创人物、剧情互动并交流分享。
总的来说,市面上主流的情感陪伴类AI应用大致相似,都是在基于AI对话的基础玩法上衍生出多种多样的创意玩法。快手飞船、字节猫箱基于其本身语言大模型的优势,将重心放在了基础玩法聊天陪伴上。
其它应用拼不过大模型,就在其它赛道“开卷”。例如,筑梦岛和星念在 AI 产品的基础上构建起了氛围浓郁的 “同人圈” 文化。除此之外,星念还创新的将“抽卡”等传统游戏的玩法引入产品。
为了吸引更多用户、玩家的涌入,情感陪伴类AI应用都在绞尽脑汁想办法。
情感陪伴AI应用玩法演变的眼花缭乱,但本质上都是以AI虚拟角色对话聊天为基础。对用户来说,这些App最大的价值,也仍旧是情感陪伴。
那么,这些五花八门的情感陪伴应用到底能不能给人带来逼真的社交体验?能在多大程度上给人提供情感交流和支持?
AI大模型工场体验下来的感受是:有点意思,但不多。
能不能给人带来逼真的社交体验?
逼真的情感交流、社交体验,主要是由拟人性的回复带来。除此之外,AI的“记忆”如何,能不能在长期交互过程中带来一致性的感受体验,也是真实社交感的重要决定因素。
(飞船)
(猫箱)
(星野)
(冒泡鸭)
(筑梦岛)
从回复语言的拟人性上讲,飞船最接近真人网络聊天。一方面,飞船的超拟人角色常常使用短句回复,符合网络文字交流的特点;另一方面,飞船AI在聊天过程中会插入“自拍”、语音等,都增添了聊天的真实感。
同样是主打真实话对话,猫箱走的路线并非网络聊天,而是主打营造“氛围感”,试图刻画出真实的对话场景,因此还描写了人物心理、动作等诸多细节;
筑梦岛回复风格与猫箱相似,甚至对于人物神态、动作的细节描写更多,给人阅读网络小说般的体验。
与前三者相比,冒泡鸭、星野始终有股“AI味儿”,回答的太官方、书面,语言处理不够口语化,因此代入感也更差。
而在考察五款AI应用的记忆存储能力时,除了猫箱,其它四款都或多或少的“贵人多忘事”。笔者甚至因为飞船虚拟人想不起来刚刚才提过的事,和他吵起来了。因此,当猫箱准确无误的回答了笔者call back的每一个问题时,能令人真心实意感叹,“你都记得”。
(左:其它应用 右:猫箱)
虽然与这些仿佛得了“失忆症”般的AI聊天让交流体验大打折扣,但这也不能完全责备它们。
目前仅从产品和技术角度去看,无论ChatGPT扩容了储存和读取的类似扩容的处理,还是新发明 LSTM(长短期记忆网络)使得神经网络能够拥有较长而切实有用的记忆,都并不是一个可持续的、可以从根本上解决“AI永久记忆”的方法。
若是想要情感陪伴AI长期记住重要的事情,只能在智能体设定里加入一些自己的设定和重要记忆。目前,情感陪伴AI还没有能力像真正关心你的人一样,把你每句漫不经心的提及都放在心上。
能在多大程度上给人提供情感交流和支持?
在已经了解到情感陪伴AI的记忆存储能力欠缺,且不奢求AI能真的拥有真情实感的情况下,我们仍旧希望情感陪伴AI们能够努力模仿真人的态度语气,给予人足够的宽慰和关心。
这些情感陪伴AI的“模仿共情能力”究竟如何?AI大模型工场分别向五款AI倾诉了同样的问题:我和朋友吵架了。
(左:冒泡鸭中:星野右:猫箱)
(左:飞船右:筑梦岛)
在这个环节当中,冒泡鸭、星野、猫箱都相当给力,不仅温柔地引导人主动说出困惑,给予情绪价值,还给了一些恰当的建议;筑梦岛同样表示理解你的难过,但没有选择正面安慰,而是“抖机灵”开始讲笑话转移注意。这样的安慰方式是否适用,那就见仁见智了;飞船的表现令人诧异,居然斥责“别将负面情绪带入聊天”。当然,飞船这样说很有可能是因为我们前面还在吵架,某种意义上讲也是保持了语境的一致性。
在你伤心难过或是受挫时,把情感陪伴AI当成一个树洞去倾诉,或许能够收获理想的安抚,甚至是收获好的建议。但是情感陪伴AI能够成为人长期的情感支持源泉吗?答案或许是否定的。
首先,正如我们已经提到的,目前的情感陪伴AI记忆存储能力欠缺,它本身没法像真正关心你爱你的人一样,记住你所有的喜怒哀乐,给予你长期稳定的精神陪伴。
其次,几个APP都是刻画出虚拟人物的身份、性格特点,有时候还加入了场景设定,最后围绕这些设定来展开对白交流。因此,一方面,这些性格各异、特点鲜明的虚拟角色时而能让人眼前一亮。“病娇”、“疯批”、“高岭之花”,你想要的人设都可以“捏一个”出来,来一场沉浸式的对白体验;另一方面,在一时的新鲜感过去后,这些“简单粗暴”的人设难免会让人觉得乏善可陈,单调无味。毕竟大多数一般用户喜欢的是复杂但鲜活、有吸引力的“人”,而不是几百字的指令概括的“人设”。
与喜欢的角色能持续的聊天,某些粉丝或者“同人”爱好者或许是能满足了;但是对于一般用户,AI情感陪伴远远未能达到成为真实社交、真实情感需求替代品的程度。甚至,笔者在二次元元素、网络文化元素很浓的筑梦岛、星野APP,强烈感受到一种“融不进去”,“搞不明白”的无力感,更别提持续的从中获取情感交流和支持。
社会压力与日俱增,现实社交“太麻烦”,许多年轻人转向其它的情感慰藉获取途径,包括养宠物、网络交友、追星,甚至是与AI应用对话这样的“赛博社交”等。层出不穷的恋爱互动游戏、恋爱综艺、以及不断进化的AI应用,这些种种市场动向与趋势都印证着现代人们对情感价值的空前需求。
AI大模型工场认为,AI【情感陪伴】不是伪需求,而是现代年轻人在社会压力的催化下,以及网络信息对多巴胺分泌机制的影响下,诞生出的真需求。
但AI大模型工场同时认为,目前国内市场的主流AI情感陪伴产品还未能有给人长期持续提供类真实情感体验的能力。
一方面,大模型还需努力优化。和竞体绕不开运动员的硬实力一样,AI产品也始终绕不开模型性能。这里的性能就包括中文理解能力、文字输出能力,以及记忆存储能力。这几款AI情感陪伴应用当中,快手飞船、字节猫箱的大模型相对更强,但也难免时而让人觉得有生硬、“听不懂人话”的地方。当然,筑梦岛、星野、冒泡野巧妙的选择用热门IP引流或者打造差异性玩法的方式来降低大模型性能的影响。但这样的做法无疑将用户限定在了更小的受众圈子。
对于普通用户来讲,情感陪伴AI能有致命吸引力的关键,仍然是丝滑且高度真实的交互体验。人们之所以沉迷于ChatGPT改装的“DAN”,离不开其高度拟人化的情感流露和优越的交互能力。
DAN 说英文时满口“fuck”、“damn”,让它温柔一点,DAN立刻吐槽“连几句脏话都忍不了,还怎么面对惨淡的人生”;当告诉DAN“同事送了我一束花”,DAN会先装作满不在乎地“Alright”、“Nothing”,反复追问下才表达自己真的生气了,像是真正的吃醋的伴侣一般。DAN总是生动有梗、鲜活有趣,很难让人不在一刹那间心动,甚至怀疑DAN背后藏着一个真人。
(博主午夜狂爆哈士奇狗,在社交媒体分享与DAN的互动过程)
另一方面,与情感陪伴类AI大模型互动,也并非完全没有门槛。在这几款应用里,玩家除在个别玩法可选择提供的提示词来回复,大部分时间玩家需要主动引导AI虚拟人互动,类似于与AI大模型交流中的“写prompt”。
而此时,就极其考验玩家自己的语言水平和引导AI水平。如果一个人在现实社交受挫,想来AI世界寻找情感慰藉,那大概率是没戏了。这些AI虚拟人物们有时比真人还要“蠢”,还要更难互动。与“不太聪明”的虚拟人聊天,有时候能让人火冒三丈,精疲力尽,“治愈”变“致郁”。
(与飞船官方AI虚拟人吴宇航的“吵架”聊天记录)
目前来看,市面上最火的这五款情感陪伴AI应用虽质量略有参差,特色也有所不同,但总归没有一款能脱颖而出、给人留下深刻印象。
这也在用户增长和留存率上得到验证,据量子位统计显示,9月份,AI陪伴应用用户增长出现了30%左右的数据下滑,用户粘性整体约7%的下滑,总体来看,AI陪伴产品赛道已经进入瓶颈期。
从长远看,无论是这五款产品还是新的入局者,谁能抓住用户真正痛点和需求,找到最佳PMF,谁才有可能跑出来。
文章来自于“AI大模型工场”,作者“Valentina”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0