试水AI陪伴,存在技术难度高、成本高、效果难保障等痛点。
生成式 AI正在以前所未有的速度重新定义人与机器的互动。
2023年,AI陪伴开始走进日常生活,2024年,便已经不再局限文本交流,而是以数字人化身的形式出现,并实现实时语音对话。两年时间里,不管是用户规模,还是商业收入,或是技术能力,AI陪伴发展迅猛,广阔的市场空间,巨大的发展潜力得到广泛认可。
知名风投a16z每半年发布一次的全球AI产品Top100榜单中,一年前AI陪伴应用仅有2家,而至今年3月已经有8种应用跻身前50,并且在最新的榜单中,16%的产品为AI陪伴产品,此类应用排名整体更加靠前,其中WEB类前20个应用中就有6个属于陪伴类。
AI陪伴已经是当下人工智能领域成长最快速增长的赛道之一。据数据网站Insightrackr,AI陪伴类产品从今年二季度开始,特别是5月到7月,每月的下载量较上月平均增加94%。另据Statista数据,2022年全球虚拟人工智能同伴市场规模已经达到8.97亿美元。预计到2030年,这一市场将以26.6%的年复合增长率增长,市场规模达到62亿美元。
从实际案例中也可以看到,国外AI陪伴应用Character.AI截至今年年中移动端累计下载量已达3432万,网页端6月单月访问量达3.1亿。产品在前述榜单网页排名中位列第二,仅次于ChatGPT;Replika今年的内购收入已超过900万美元,全球累计收入接近9000万美元;今年上半年,两款国产AI伴侣应用Talkie和Poly.ai就登上了美国AI应用市场下载榜的前十……
或许可以说,AI陪伴产品是目前热度最高、变现最为明确的AIGC原生产品。
AI陪伴效果图(图源Pixabay)
事实上,大模型和多模态内容生成能力的加入,让AI陪伴“拟人化”程度大幅提升,用户获得更高的创作自由度和陪伴体验,且得到实时的反馈与稳定的情绪,让AI陪伴类软件上线后获得大量用户支持,而在需求、技术和产品三重助推下,AI陪伴高速发展的前景具有极高确定性。
而当AI陪伴成为生成式人工智能的主流应用,如何才能更好地参与到这波浪潮中?
大模型强大的自然语言理解能力、生成式AI回复的不确定性,加上用户对聊天陪伴的需求,使得AI陪伴成为目前AI重要落地场景,并迅速成为行业、用户的宠儿。
去年a16z就曾指出,AI伴侣将是人工智能落地的第一批杀手级应用。观察近两年AI应用的发展情况会发现,无论是科技巨头还是初创公司,几乎都布局了AI陪伴这一赛道:InflectionAI的Pi、Snapchat的MayAI、Meta的MetaAI,国内百度的小侃星球、美团的Wow,国内“AI五小龙”也几乎都推出了类似产品……
具体到国内,从2023年开始试水,到2024年各大厂商躬身入局,AI陪伴应用呈爆发式发展。在今年,各家厂商也持续发布自家AI陪伴产品:3月字节上线AI社交APP“话炉”,4月百度推出添添闺蜜机,5月Soul曝光“异世界回响”,6月百川智能推出AI剧情互动小程序……
AI陪伴已经成为必须发展的业务之一。从目前AI陪伴头部应用看,Character.AI在2024年8月MAU创历史新高,达2200万人,1-8月下载量达到1900万;Talkie下载量紧追Character.AI,但在美国市场,其下载量已经超过Character.AI……这也就意味着,从PMF(产品市场匹配度)角度看,AI陪伴的价值已经得到证实。
之所以AI陪伴成为人工智能领域落地最快的领域,和AI陪伴相比真人社交具有即时性、定制化、养成感;和AI内容应用相比具有沉浸感、多样化、低门槛的差异化特性有着很大关系。
国联证券研究指出,AI陪伴能做到24小时、全天候、随时随地响应;用户可根据自身需求,定制交流对象的一切特点,满足个性化需求;核心用户共同创造数据飞轮:AI智能体在被创造之后,可以在使用过程中逐步贴合用户需求,带来“养成感。该机构同时表示,AI陪伴能够让内容体验“活起来”,提升用户的沉浸感;用户也可以在同一AI陪伴平台上消费多样化的内容;AI陪伴内容创作门槛被极大降低,一方面用户创作的需求被进一步满足,另一方面UGC有望推动内容生态的丰富度实现数量级增长。
可以看到,随着AI陪伴的接纳度提升,玩法多样的AI陪伴逐渐成为泛娱乐领域的“标配”,其中在社交领域最为典型:用户不仅能够个性化定制专属AI Agent,也能在精心设计的剧情中与AI角色深度互动,网红、主播、明星还能克隆制作AI分身,强化与粉丝间的感情链接……
值得关注的是,虽然当下众多玩家参与到AI陪伴的赛道,但决定能否脱颖而出的关键点是AI角色是否“聪明”,是否能够准确理解用户意图,以及是否“拟人化”,为用户提供接近真人的情感体验,这些功能得以实现,离不开大模型能力的支持。目前,国内外头部AI情感陪伴类应用多基于经过优化的商用大模型,包括海外Character.AI、Pi,国内星野、筑梦岛等。
无疑,AI陪伴已经成为“香饽饽”,但对于想要入局这一赛道的玩家,想要从0到1打造高质量AI陪伴应用并非短期、低成本就能实现的。
作为全球领先的实时音视频云服务提供商,即构科技在2024年9月的云栖大会上曾分享,试水AI陪伴,主要有两方面难点,一是接入方面,通常需要2个月以上,成本相对较高:接入多家厂商的语音识别(ASR)、语音合成(TTS)、大语言模型多个产品;服务端高可用性的复杂逻辑开发、处理大量请求的性能优化、全球部署的资源成本等;还需接入搭配RTC等实时互动产品,并将AI融入到1v1、语聊房等场景。二是在成本高企的情况下,效果还难保证:AI回应延迟过高,>4s;角色生硬,机械感十足;角色、人设单一。
简言之,试水AI陪伴,存在技术难度高、成本高、效果难保障等痛点。
而洞察到行业痛点,即构科技推出「AI陪伴」解决方案。该方案控制成本,能在2周左右快速接入,抢占市场先机,并且能保证效果,还原真实人物性格、语气,给予用户情感反馈体验,适用于AI伴侣、剧情演绎、虚拟咨询、克隆主播等常见场景。对于想要试水AI陪伴的厂商而言,只需要寻找相应的落地的细分用户群体及业务场景,寻找PMF,来更好地满足现有用户需求或者找寻新的市场。
即构科技「AI陪伴」解决方案架构
根据LitGate数据,到2030年,AI陪伴产品每年会占据用户7000-9000亿小时,商业化水平也有望从当下的每小时0.03美元增长到2030年的0.16美元,总市场规模大约在1120亿-1440亿美元。庞大的商业潜力,成为必须入局AI陪伴的理由,但要如何实现产品落地并实现商业化运作?
首先,今年以来,5月份通义千问、豆包、MiniMax等模型大幅降价,9月份云栖大会上通义千问降价,openAI也推出成本更低的GPT-4o mini……大模型使用成本的进一步降低,让AI落地应用的商业可行性更高,让AI陪伴铺开具备了基础。
其次,虽然AI陪伴需求已被证实,但要实现商业化运作还要理解用户对AI陪伴的核心需求,即目前用户使用AI陪伴最大的需求——“建立浪漫关系”,这不仅是技术上的挑战,更考验着开发者对人性的深入理解。
据观察,目前,AI陪伴类产品设计思路基本可以分为两种,深耕垂类场景以及覆盖通用场景,前者聚焦核心用户,后者覆盖泛用户。
具体来看,在聚焦核心用户方面,目前国内典型如星野、筑梦岛,从产品UI设计,到AI生成的人物形象、聊天风格等均偏向二次元风格。此类产品针对的核心用户为时间充裕,自身是二次元动漫游戏、追星等亚文化爱好者,社交圈子相对封闭、寻求虚拟世界情感寄托的群体。其优点在于目标用户明确、需求清晰,缺点核心用户群体规模较小,场景较为局限,破圈难度较大。
在覆盖泛用户方面,Character.AI是其中典型,UI设计极简,不去主动筛选垂类用户,不偏向任何垂直的场景。用户可以把它定义为认识的某个人、明星、IP角色、心理医生,也可以只是想像中的人物,并不限制角色类型。此类产品覆盖用户类型、场景极广,发展空间广阔,相对而言,其劣势在于用户、场景不聚焦,且UI对社区内的内容、用户呈现较弱。
试水AI陪伴,寻找PMF,无疑将择一而行。对此,即构科技根据客户痛点,推出的AI陪伴解决方案整合了当下最热门的AI陪伴互动场景和功能玩法,互动场景框架、智能体模版管理系统、以及智能体工作流编排能力强,具备可拓展能力,为开发者提供一站式的AI陪伴解决方案与Demo。
即构科技「AI陪伴」解决方案核心优势
这一方案仅需简单对接操作,即可实现文字陪聊、语音通话、视频通话等场景,其将AI、数字人技术等与IM、RTC无缝融合,基于场景核心,优化业务、简化开发部署流程,让客户快速部署各种形式的AI陪伴,加速业务验证和市场响应。
据介绍,在产品能力上,即构科技AI陪伴解决方案支持文本、实时语音等多模态交互,实现灵敏准确的语音打断功能;同时人设丰富“千人千面”:提供个性角色风格选项,结合灵活的对话记忆,精准捕捉用户情绪;用户获得精准的拟人化的内容反馈之余,还能获得自然人声情感体验,如多家厂商总共近百种的音色选择、30s即可快速复刻音色、根据人设、语境,像人一样做出带有不同情绪的回复等。在保证效果的基础上,还提供超低延迟的沉浸式体验:文字互动延迟500ms以内,语音互动最低至1s。
即构科技「AI陪伴」解决方案体验优势
该方案在多模态能力外,还具有最快2周内即可完成IM聊天及语音通话的场景接入、兼容MiniMax、通义千问、豆包、ChatGPT等国内外各种商用模型及开源模型、搭配Prompt最佳实践、结合RAG、LoRA等优化效果,更好地匹配AI角色的技术优势。
此外,即构科技支持多种客户端接入形式,譬如UIKits——更轻松、便捷的低成本选择,属于通话、互动聊天等含UI的场景化SDK;基础SDKs——更多能力的高级定制选择,属于实时音视频、即时通讯等不含UI的SDK。
总言之,试水AI陪伴只需要专注于业务层面的AI的角色打造及场景运营等,这也促使用户可以更多关注用户、市场需求,成为“突出重围”的特色应用。
文章来自于“36氪产业创新”,作者“36氪产业创新”。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales