ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
当AI陪伴成为泛娱乐确定性赛道,如何入局?
9104点击    2024-10-10 17:42

试水AI陪伴,存在技术难度高、成本高、效果难保障等痛点。


生成式 AI正在以前所未有的速度重新定义人与机器的互动。


2023年,AI陪伴开始走进日常生活,2024年,便已经不再局限文本交流,而是以数字人化身的形式出现,并实现实时语音对话。两年时间里,不管是用户规模,还是商业收入,或是技术能力,AI陪伴发展迅猛,广阔的市场空间,巨大的发展潜力得到广泛认可。


知名风投a16z每半年发布一次的全球AI产品Top100榜单中,一年前AI陪伴应用仅有2家,而至今年3月已经有8种应用跻身前50,并且在最新的榜单中,16%的产品为AI陪伴产品,此类应用排名整体更加靠前,其中WEB类前20个应用中就有6个属于陪伴类。


AI陪伴已经是当下人工智能领域成长最快速增长的赛道之一。据数据网站Insightrackr,AI陪伴类产品从今年二季度开始,特别是5月到7月,每月的下载量较上月平均增加94%。另据Statista数据,2022年全球虚拟人工智能同伴市场规模已经达到8.97亿美元。预计到2030年,这一市场将以26.6%的年复合增长率增长,市场规模达到62亿美元。


从实际案例中也可以看到,国外AI陪伴应用Character.AI截至今年年中移动端累计下载量已达3432万,网页端6月单月访问量达3.1亿。产品在前述榜单网页排名中位列第二,仅次于ChatGPT;Replika今年的内购收入已超过900万美元,全球累计收入接近9000万美元;今年上半年,两款国产AI伴侣应用Talkie和Poly.ai就登上了美国AI应用市场下载榜的前十……


或许可以说,AI陪伴产品是目前热度最高、变现最为明确的AIGC原生产品。


AI陪伴效果图(图源Pixabay)


事实上,大模型和多模态内容生成能力的加入,让AI陪伴“拟人化”程度大幅提升,用户获得更高的创作自由度和陪伴体验,且得到实时的反馈与稳定的情绪,让AI陪伴类软件上线后获得大量用户支持,而在需求、技术和产品三重助推下,AI陪伴高速发展的前景具有极高确定性。


而当AI陪伴成为生成式人工智能的主流应用,如何才能更好地参与到这波浪潮中?


01 “香饽饽”AI陪伴,入局不易


大模型强大的自然语言理解能力、生成式AI回复的不确定性,加上用户对聊天陪伴的需求,使得AI陪伴成为目前AI重要落地场景,并迅速成为行业、用户的宠儿。


去年a16z就曾指出,AI伴侣将是人工智能落地的第一批杀手级应用。观察近两年AI应用的发展情况会发现,无论是科技巨头还是初创公司,几乎都布局了AI陪伴这一赛道:InflectionAI的Pi、Snapchat的MayAI、Meta的MetaAI,国内百度的小侃星球、美团的Wow,国内“AI五小龙”也几乎都推出了类似产品……


具体到国内,从2023年开始试水,到2024年各大厂商躬身入局,AI陪伴应用呈爆发式发展。在今年,各家厂商也持续发布自家AI陪伴产品:3月字节上线AI社交APP“话炉”,4月百度推出添添闺蜜机,5月Soul曝光“异世界回响”,6月百川智能推出AI剧情互动小程序……


AI陪伴已经成为必须发展的业务之一。从目前AI陪伴头部应用看,Character.AI在2024年8月MAU创历史新高,达2200万人,1-8月下载量达到1900万;Talkie下载量紧追Character.AI,但在美国市场,其下载量已经超过Character.AI……这也就意味着,从PMF(产品市场匹配度)角度看,AI陪伴的价值已经得到证实。


之所以AI陪伴成为人工智能领域落地最快的领域,和AI陪伴相比真人社交具有即时性、定制化、养成感;和AI内容应用相比具有沉浸感、多样化、低门槛的差异化特性有着很大关系。


国联证券研究指出,AI陪伴能做到24小时、全天候、随时随地响应;用户可根据自身需求,定制交流对象的一切特点,满足个性化需求;核心用户共同创造数据飞轮:AI智能体在被创造之后,可以在使用过程中逐步贴合用户需求,带来“养成感。该机构同时表示,AI陪伴能够让内容体验“活起来”,提升用户的沉浸感;用户也可以在同一AI陪伴平台上消费多样化的内容;AI陪伴内容创作门槛被极大降低,一方面用户创作的需求被进一步满足,另一方面UGC有望推动内容生态的丰富度实现数量级增长。


可以看到,随着AI陪伴的接纳度提升,玩法多样的AI陪伴逐渐成为泛娱乐领域的“标配”,其中在社交领域最为典型:用户不仅能够个性化定制专属AI Agent,也能在精心设计的剧情中与AI角色深度互动,网红、主播、明星还能克隆制作AI分身,强化与粉丝间的感情链接……


值得关注的是,虽然当下众多玩家参与到AI陪伴的赛道,但决定能否脱颖而出的关键点是AI角色是否“聪明”,是否能够准确理解用户意图,以及是否“拟人化”,为用户提供接近真人的情感体验,这些功能得以实现,离不开大模型能力的支持。目前,国内外头部AI情感陪伴类应用多基于经过优化的商用大模型,包括海外Character.AI、Pi,国内星野、筑梦岛等。


无疑,AI陪伴已经成为“香饽饽”,但对于想要入局这一赛道的玩家,想要从0到1打造高质量AI陪伴应用并非短期、低成本就能实现的。


作为全球领先的实时音视频云服务提供商,即构科技在2024年9月的云栖大会上曾分享,试水AI陪伴,主要有两方面难点,一是接入方面,通常需要2个月以上,成本相对较高:接入多家厂商的语音识别(ASR)、语音合成(TTS)、大语言模型多个产品;服务端高可用性的复杂逻辑开发、处理大量请求的性能优化、全球部署的资源成本等;还需接入搭配RTC等实时互动产品,并将AI融入到1v1、语聊房等场景。二是在成本高企的情况下,效果还难保证:AI回应延迟过高,>4s;角色生硬,机械感十足;角色、人设单一。


简言之,试水AI陪伴,存在技术难度高、成本高、效果难保障等痛点。


而洞察到行业痛点,即构科技推出「AI陪伴」解决方案。该方案控制成本,能在2周左右快速接入,抢占市场先机,并且能保证效果,还原真实人物性格、语气,给予用户情感反馈体验,适用于AI伴侣、剧情演绎、虚拟咨询、克隆主播等常见场景。对于想要试水AI陪伴的厂商而言,只需要寻找相应的落地的细分用户群体及业务场景,寻找PMF,来更好地满足现有用户需求或者找寻新的市场。


即构科技「AI陪伴」解决方案架构


02 落地AI陪伴,如何低成本、优效果?


根据LitGate数据,到2030年,AI陪伴产品每年会占据用户7000-9000亿小时,商业化水平也有望从当下的每小时0.03美元增长到2030年的0.16美元,总市场规模大约在1120亿-1440亿美元。庞大的商业潜力,成为必须入局AI陪伴的理由,但要如何实现产品落地并实现商业化运作?


首先,今年以来,5月份通义千问、豆包、MiniMax等模型大幅降价,9月份云栖大会上通义千问降价,openAI也推出成本更低的GPT-4o mini……大模型使用成本的进一步降低,让AI落地应用的商业可行性更高,让AI陪伴铺开具备了基础。


其次,虽然AI陪伴需求已被证实,但要实现商业化运作还要理解用户对AI陪伴的核心需求,即目前用户使用AI陪伴最大的需求——“建立浪漫关系”,这不仅是技术上的挑战,更考验着开发者对人性的深入理解。


据观察,目前,AI陪伴类产品设计思路基本可以分为两种,深耕垂类场景以及覆盖通用场景,前者聚焦核心用户,后者覆盖泛用户。


具体来看,在聚焦核心用户方面,目前国内典型如星野、筑梦岛,从产品UI设计,到AI生成的人物形象、聊天风格等均偏向二次元风格。此类产品针对的核心用户为时间充裕,自身是二次元动漫游戏、追星等亚文化爱好者,社交圈子相对封闭、寻求虚拟世界情感寄托的群体。其优点在于目标用户明确、需求清晰,缺点核心用户群体规模较小,场景较为局限,破圈难度较大。


在覆盖泛用户方面,Character.AI是其中典型,UI设计极简,不去主动筛选垂类用户,不偏向任何垂直的场景。用户可以把它定义为认识的某个人、明星、IP角色、心理医生,也可以只是想像中的人物,并不限制角色类型。此类产品覆盖用户类型、场景极广,发展空间广阔,相对而言,其劣势在于用户、场景不聚焦,且UI对社区内的内容、用户呈现较弱。


试水AI陪伴,寻找PMF,无疑将择一而行。对此,即构科技根据客户痛点,推出的AI陪伴解决方案整合了当下最热门的AI陪伴互动场景和功能玩法,互动场景框架、智能体模版管理系统、以及智能体工作流编排能力强,具备可拓展能力,为开发者提供一站式的AI陪伴解决方案与Demo。


即构科技「AI陪伴」解决方案核心优势


这一方案仅需简单对接操作,即可实现文字陪聊、语音通话、视频通话等场景,其将AI、数字人技术等与IM、RTC无缝融合,基于场景核心,优化业务、简化开发部署流程,让客户快速部署各种形式的AI陪伴,加速业务验证和市场响应。


据介绍,在产品能力上,即构科技AI陪伴解决方案支持文本、实时语音等多模态交互,实现灵敏准确的语音打断功能;同时人设丰富“千人千面”:提供个性角色风格选项,结合灵活的对话记忆,精准捕捉用户情绪;用户获得精准的拟人化的内容反馈之余,还能获得自然人声情感体验,如多家厂商总共近百种的音色选择、30s即可快速复刻音色、根据人设、语境,像人一样做出带有不同情绪的回复等。在保证效果的基础上,还提供超低延迟的沉浸式体验:文字互动延迟500ms以内,语音互动最低至1s。


即构科技「AI陪伴」解决方案体验优势


该方案在多模态能力外,还具有最快2周内即可完成IM聊天及语音通话的场景接入、兼容MiniMax、通义千问、豆包、ChatGPT等国内外各种商用模型及开源模型、搭配Prompt最佳实践、结合RAG、LoRA等优化效果,更好地匹配AI角色的技术优势。


此外,即构科技支持多种客户端接入形式,譬如UIKits——更轻松、便捷的低成本选择,属于通话、互动聊天等含UI的场景化SDK;基础SDKs——更多能力的高级定制选择,属于实时音视频、即时通讯等不含UI的SDK。


总言之,试水AI陪伴只需要专注于业务层面的AI的角色打造及场景运营等,这也促使用户可以更多关注用户、市场需求,成为“突出重围”的特色应用。


文章来自于“36氪产业创新”,作者“36氪产业创新”。


关键词: AI , AI陪伴 , AI社交 , AI娱乐
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

5
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

6
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

7
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales