这场比拼脑筋与手速的硬仗,早在 10 月 14 日就初见端倪。不少朋友表示,今年的双十一不仅战线长,规则也更加复杂。
各种眼花缭乱的平台优惠券,叠加上「国补换新政策」的 buff,让我这本就不聪明的脑子雪上加霜。
双十一最早起源于 2009 年的淘宝购物节,据相关报告显示,发展至 2023 年,天猫双十一全周期累计访问用户数已超 8 亿人。面对这已持续 15 年的购物狂欢节,大家的热情却丝毫未减。这不还没十一月,相关话题就上了好几次热搜。
种种复杂的规则之下,不少网友也发出了吐槽。“网上的省钱攻略好多都不靠谱,像引流的套路”,“花了好长时间研究规则,数学课都没这么认真过”...
这些实实在在的痛点,我们在想,能不能用 AI 来帮大家更快速地获取有效信息,抹平信息差呢?
因此,特工宇宙联合为十亿国民提供在线支付的支付宝,并基于它们最新的 AI 应用创建平台「百宝箱」,一起探索,共建了一个 AI 智能体(Agent),期望能用 AI 的能力,帮助大家在双十一期间省点时间。
在经历 14 天不间断的密集讨论与开发迭代,「双十一直播抢购搭子」如今已经上线,在支付宝首页下拉,再点击「智能体」,即可找到它。
那么,什么是智能体呢?它又厉害在何处呢?
根据业界的定义,智能体是能像人类一样感知环境、规划任务、执行动作,最终完成特定任务的实体。
一个抽象解释是,以前的 AI Copilot 是一个助手,你问它答,然后自己再主动将得到的答案、知识应用到生活当中。而 Agent 能够根据你的需求,自己反思规划总结,并直接执行任务。
在支付宝内,无需用户指定选择该智能体,当用户说出类似“双十一购物攻略”“交个朋友直播间”“我想买...”等需求时,我们的搭子会自动感知,然后“挺身而出”。
其次,搭子会自动识别当前日期,推出满足时效性的信息。还会根据用户当前时间,在没有直播,且未获取到最新的直播预告信息的凌晨 3-6 点,早上 6-9 点,以及其余时间进行不同的推送。
我们监控了各大电商平台和带货主播的信息源,一旦其有更新,我们能够自动快速获取,基于视觉模型与人工审查,快速地将该部分知识“教”给我们的搭子。
然后搭子能够判断用户输入问题的意图,进行相应的直播间、商品等信息进行推荐,并根据最近和用户的对话,智能提示联想问题。
搭子根据规划的任务,一步步执行最后整理输出,返回文字信息或卡片,用户可以直接跳转查看直播预告的海报图,或者跳转部分直播间直接进行购物(目前还在测试,即将上线)
现在这个形象动人,风格可爱,语音逼真的抢购搭子,能做到的包括:
1. 能清晰的讲解淘天、京东、抖音等平台各自双十一复杂的活动规则和时间节点;
2. 能准确、及时、免费、结构化地提供热门带货主播的直播预告、商品表等信息,为用户“货比三家”提供数据支持;
3. 根据用户和 AI 交流的上下文,智能提供联想提问,辅助用户更好地挑选适合的商品;
4. 弹出卡片,能帮助用户快速跳转相应的直播间进行购物。
在未来,她还能根据长期记忆总结用户的喜好,主动推送给用户商品和优惠券,根据用户的定位,智能推荐附近商场的打折活动...
大语言模型和 Agent 的能力正在不断进化,在未来,在生活服务场景下,依托支付宝的生态资源,我们的智能体还将能直接完成支付、物流查询、售后等环节,达到更加 Agentic 的状态。
搭子的这些 AI 能力,均由特工宇宙基于支付宝旗下的「百宝箱」中工作流功能实现,以下是我们的技术实现思路。
我们的搭子能比其他 AI 产品搜出来的信息都准的一大核心原因是——精准及时的数据源更新。
大语言模型本身是缺少实时的双十一相关信息的,需要进行补充。我们一方面自动监控了各大平台和主播的优惠政策和直播预告,另一方面利用联网功能,自动补充部分商品的详细信息。
当收到用户的提问后,先进行意图识别,然后为了更精准在数据库中检索信息,需要对用户的提问,根据理解和上下文对话记录进行合理改写。
最后,对于匹配到的大量数据,进行重排和选择,然后结合可能需要的联网数据,一并给到大模型,进行最后的输出。
我们相信,在满足用户,需求,场景三要素的前提下,不断提升平台级能力和工程手段优化,我们的搭子会更智能,更懂每个个体。
BTW,如果你也想成为新时代的开发者,有兴趣一起创造有应用价值的智能体,那么欢迎联系我们!也欢迎参加最近支付宝百宝箱的创作者活动????
智能体征集活动丨快来看看「百宝箱」里有什么!
或许下一个人人都在用智能体,就是由你而打造????
文章来自于微信公众号“特工宇宙”,作者“特工少女”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales