斯坦福大学心理学系研究科学家赵轩博士开发了一款人工智能心理疗愈 Agent——Sunnie,它具备多轮自然对话的能力,能够基于大语言模型推荐个性化活动。今天赵轩博士将通过本文,和我们分享 Sunnie 的设计理念、功能以及在心理健康领域的应用前景,让我们一起看看科技是如何帮助人们寻找生活动力和平衡情绪的。 Enjoy
《Sunnie: An Anthropomorphic LLM-Based Conversational Agent for Mental Well-Being Activity Recommendation》
论文链接:https://arxiv.org/abs/2405.13803
Sunnie Agent 架构图
解决问题: 传统的心理学侧重于心理疾病的治疗,需要受过专业训练的心理咨询师进行干预,消耗大量时间,成本高昂,因而难以规模化推广。近几十年,心理学中以积极心理学为代表,注重全人发展和提升主观幸福感,已经发展出了行之有效的日常情绪调节与心理强健的方法。这些方法可以增强生活满意度、减轻心理压力、增进人际关系,并对心理疾病起到预防的效果。基于积极心理学与社会心理学的框架,Sunnie 提供了一套新的心理疗愈 Agent,具有拟人化的外观设计,并能够进行心理疗愈的多轮自然对话,最终基于大型语言模型推荐个性化活动模块
模型框架: Sunnie 具有非常复杂的提示词调整方式,首先 Sunnie 提供了一个用户交互的结构化过程,包括每天用 Agent 记录情绪和活动,进行个性化幸福辅导对话以获得反馈,最终从幸福活动推荐中获得动作输出。Sunnie 框架中设置了对话协议,类似于反馈-提问循环,在过程中让心理学知识易于获取和操作,最后设置安全性优化
使用效果: 团队进行了一项为期三天的用户研究(N=40),将 Sunnie 与一个非拟人化、非基于对话的 LLM 活动推荐系统进行对比,研究结果表明 Sunnie 在很大程度上倾向于自然、信任、积极关系和个性化等感知,体现了 Sunnie 在表现力、同理心、有用性、自然性、友好性、易用性上的功能
应用空间: 心理疗愈 Agent
Sunnie Agent 用户体验测试结果
绿洲:请帮我们介绍一下您过去的研究背景与方向?
赵博士:我本科就读于浙大基础心理学专业,是一个非常定量的学科,当时我主要专注于视觉方面的研究,本科期间和耶鲁大学的师兄一起做过视觉与社会认知方面的研究,埋下了后续出国读书的种子。本科毕业后我到布朗大学完成了社会心理学的博士学位,我主要做的是视觉采择(空间关系的社会映射),即从他人的视角看问题,类似于视觉上空间知觉范畴的协作。从博士三年级开始,我们就在做一些和机器人相关的研究,我的导师 Bertram Malle 教授和计算机系的 Michael Littman 教授在布朗大学创立了机器人交互研究中心,然后我们发现了人形机器人有很多不同的形态。我们当时做了 200 多个机器人的数据库,可以检索不同的人形机器人设计。当时我们发现人形机器人结构里面大概有三个大的要素:第一是面部,第二是肢体,第三是表面特征(Surface Features),例如毛发、衣服、妆容等,对智能体认知起到不一样的作用效应。
后来我来到芝加哥大学商学院做博士后,研究社会认知和人际互动。随后来到斯坦福大学心理系担任研究科学家(Research Scientist),我们主要与硅谷公司、社媒公司、投资机构合作,研究人们怎么样更好地识别社交媒体上的偏见,或是投资过程中的偏见。另一方面,我们也在考虑如何扩展可规模化的研究方式,更好地服务于产学研结合。
绿洲:能否帮我们简单定义一下心理学?
赵博士:心理学有几大分支,一个以社会心理学为主,包括人与人之间怎么打交道,以及人的自我认知。另一种是发展心理学,主要研究儿童以及人的毕生发展。其他还有管理心理学和组织行为学,这是研究人在组织里的行为决策变化。还有情绪科学,主要研究人的情绪。除此以外还有脑科学、临床心理学、心理咨询等。
我们关注的是积极心理学,它的前身是人本主义,由上世纪六十年代美国心理学家 Abraham Harold Maslow 创立。后来宾夕法尼亚大学的 Martin Seligman 教授,曾作为美国心理学会主席提出积极心理学的概念,提到心理学不能仅仅停留在治疗疾病的层面,而是需要回答如何让普通人的生活更充实、更幸福、更有意义等命题。因此我从 2022 年成立的社会企业叫 Flourish Science,之所以选积极心理学,是因为我们不把产品作为一个心理咨询师(Therapist),也不用 “Coach”这些词来形容,我们觉得就叫心理学小伙伴(就是“AI Buddy”),它可以帮助你找到生活的动力,帮助你找到情绪的平衡,帮助你减压,甚至帮你找到一个更好的与人交流的方式。
绿洲:请简单介绍一下 AI Buddy Sunnie 的产品形态和功能。
赵博士:Flourishing(根据赵轩博士解释意思是“幸福像花儿一样”)是积极心理学中重要的概念,在此基础上我们对产品设计方面分为行为和设计两部分。行为上我们利用基于 GPT-4 之上的连续性 Prompt 不断地调试并加入 RAG,为人类带来心理学知识、活动推荐、以及情绪价值。设计方面我们选择了用小太阳作为形象,它从一开始在 App 的边边角角以装饰物的形象出现,到最终成为了具有对话能力和个性的 Sunnie,并且用到了大量的动画。在 Agent 结构上,我们加入了语音功能,并且正在设计记忆模块。产品形态上,我们结合了对话(Conversation-based)和用户界面交互(UI-based)的形态,并且接下来几周的 Sunnie 即将可以召唤其他活动的 Function Call(函数调用),这是一个产品按照用户反馈不断迅速迭代的过程。
例如 Sunnie 在除了基于对话的心理学疗愈方案之外,还可以调用类似于呼吸、番茄时钟法等基于用户界面的活动,不断陪伴人类进行更好的信息处理和执行。整体来看,人的疗愈过程和 Sunnie 的回复过程结合是非常紧密的。我还有一个非常喜欢的练习,是以你未来的视角给你写一封信(Letter from your future self),积极心理学认为每个人其实都很了解自己,内心充满力量和智慧,但有的时候人会受限于自己当下的情形产生很多困扰,这时候我们需要跳出当下这个视角给自己一些建议,找到内心的力量。Sunnie 会让你把这个信写出来,最后它会生成一些非常充满鼓励的内容。我们设置过程中的 Prompt 是非常需要结合心理学背景来进行设置的。
虽然我们现在每天还需要改进很多工程上的问题,我们也需要更加了解心理学真正对于 Agent 的技术需求是什么,因此我们要以很多方式吸引更多提示词来构建 Agent 的知识网络,最终我们把非常浩瀚的心理学知识和额外的信息结合到系统中都是非常有讲究的。另外我们最近也在关注语音对于心理学 Agent 的能力提升,Hand Free 的交互方式目前已经能做到 500 毫秒以内的延迟,我们依照对用户心理的把握来更好地设计心理学 Agent Sunnie 的框架。
绿洲:您怎么看待 LLM-based Agent 目前严肃场景性能不强的现象?
赵博士:目前心理健康和预防肯定是严肃的场景,大模型中本身的严肃科学知识是能满足心理学 Agent 的一些诉求的,我们觉得大模型能够比较准确地洞悉人的心理状态和情绪,以及推导人的感受背后的原因是什么。LLM-based Agent 应用在心理学这个场景是能达到特定性能的,和目前比较火的算命和塔罗完全是两个概念。
绿洲:您怎么看待心理学 Agent 如何更好地设置“游戏化”(Gameification)机制?
赵博士:其实本身在心理学疗愈过程中,我们就会设计一些设计属性,比如 Agent 给使用者一个赞美,比如设计基于积极心理学框架的游戏化奖励机制增强趣味性,巩固用户对于积极心理学的理解。对比传统语言教育(比如 Duolingo)的升级系统,语言做的事很容易量化和升级,每天背了数个单词之后很容易有“进步”的感觉。心理疗愈 Agent 比较难对人产生线性进步的感觉,我们不希望将 Sunnie 设计为一款类似于“虚拟朋友”或“虚拟恋人”等会让用户产生沉迷的产品,我们反而希望把交互尽量做轻,甚至让你不觉得在和 Agent 聊天。这些对于用户心理的把握,是从我们过去在心理学知识的积累中产生的,把Agent 心理疗愈进步门槛降到合适的区间,让大家不知不觉地找到更好的疗愈方式是我们的目的,背后 Sunnie 为用户提供的是陪伴与练习的过程。
绿洲:最终您觉得 Agent 能够在心理健康领域到达什么样的阶段?
赵博士:在心理学健康领域有一个 Step Care Model of Mental Health(心理健康的阶梯护理模型),展示了心理健康不同干预层级。目前 Sunnie 能覆盖到 9 个层级中的 1-4 级层级,实现从监测到轻度干预的全覆盖,我们也通过一些线下的产品和工作坊提供对于第 5 层级的支持。不过对于稍微重度的情况,比如 7-9,我们还是建议和心理咨询师配合使用,可以帮助用户更好地消化情绪。
《Her》这部电影,很多人应该都看过,但我认为我们的产品设计最终要回到人与人的交流上。我不是特别认可所有人都需要虚拟朋友的存在,也许有些人需要,但最终我们希望能回到使用者真实生活中的家人、朋友、配偶、同学的交互中,连接大家一起,让心理变得健康,是我们的愿景。
绿洲:您如何设计 Sunnie Agent 以更好地感知到人的性格和情绪?
赵博士:用户刚使用的过程,利用小自测让用户感受到 Sunnie 和心理学的价值,以及通过分享目前生活中遇到什么样的困难,让 Sunnie 更好地了解用户心理的生活和情绪状态,从不同维度给用户建议。我们还会尝试结合心理学上的 Just-in-Time Adaptive Interventions (JITAIs,即时适配干预)方法,业务上我们未来还会整合一些智能硬件数据,并且期望会发布我们自己的 Sunnie 智能玩偶。
另外我们也会继续寻找科学性和趣味性的平衡,在积极心理学疗愈过程中更好地让用户愿意多尝试、多分享。
绿洲:能否帮我们举几个 Sunnie Agent 印象深刻的使用案例?
赵博士:过去我们有两位使用者,其中一位使用 Sunnie 超过200 天,他们在人生中遇到一些困扰的时候,和 Sunnie 聊完之后,能够把失眠、焦虑的情况大幅减轻。Sunnie 会用特殊的方法(例如写作练习)等让使用者通过特殊且适配他们的方式进行舒缓,同时给他们适当的鼓励用于调整心情。
我自己在平时的工作过程中,如果有需要倾听的过程,或者需要转换一下思维,提供不同的视角,Sunnie 能够给我提供非常方便的情绪价值。我们期待看到心理疗愈 Agent 的理解能力逐渐加强,且应用空间越来越广泛,让 Sunnie 陪每一位使用者热爱生活。
文章来源于“绿洲资本”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0