AI落地有多远?支付宝用新APP交出答卷。
给AI下个“咖啡”的指令,它大概率会给你介绍咖啡的文化和市场,“聪明”一点的会推荐附近几家咖啡店,进阶“玩家”则懂得去呈现一些顾客店铺、评分较高的单品,甚至是如何到达的路线。
但现在,你可以更进一步,通过AI助手完成购买咖啡的动作。
打开支付宝新推出的AI独立App“支小宝”,通过对话告诉它“帮我购买一杯瑞幸的冰拿铁,到店取”,选择杯型和温度后就可以跳转到相应的小程序点击进行购买。所有操作都在支小宝App内完成。
支小宝是个注重“你说我办”的务实派,买一杯咖啡、订一张机票、安排一次旅行这样的小事,都能帮忙“跑腿”完成。
GPT为代表的大模型涌现后,关于如何从chat进化到work,业界仍处于探索的阶段。
从很多AI产品的功能上看,侧重聊天交流、辅助创作是主流。支小宝的产品逻辑则不同,作为一个AI生活管家,其以支付宝庞大的商业生态为基底,不走花里胡哨的路线,主打一个实用。
按照蚂蚁集团总裁韩歆毅的说法,从“拼参数”走向“拼应用”,支小宝的目的是为了让AI融入平台、落入生活,为用户提供好用、有用、用得起的服务。
支付宝作为国民App,应用场景大而全,也不可避免地会有复杂冗余的问题。把支付宝内部场景当做“磨刀石”,打磨这背后的数据、场景、技术,构建AI连接生活服务的全新可能性,或许才是支小宝的试图达成的使命。
“支付宝推出的AI生活管家,希望让洞悉世界的大模型,变成更懂用户的小助理。”
说这话的是王翼飞,他是支小宝的产品负责人,在 9 月 5 号上海举行的外滩大会上,他被好奇的人群围了个水泄不通——大家迫切地想知道,支付宝筹备已久的这款AI应用到底有什么不一样。
和大众对人工智能、大模型的普遍印象不同,支小宝不是什么高深莫测的复杂科技,而是一个人人都能用的AI应用。
首先,找到支小宝就是一件很简单的事情。可在各大个应用市场下载使用;同时,它内嵌在支付宝中,在支付宝App首页下拉也能体验。
其次,命令支小宝也不复杂。区别于传统的图形用户界面,支小宝采用全新的对话式交互,用户下达口语指令后,不用再烦心寻找或输入,就能简单找到各种生活服务,实现更聪明的“你说我办”。
还有一个其他应用做不到的“秘密”,就是支小宝的“管家感”。
连接支付宝生态,支小宝可通过对话快速订票、点餐、打车、查询附近吃喝玩乐等,说句话就能办事。
通勤路上,腾不出手打字,用一句话唤出地铁码或公交码,还可以轻松找到附近的共享单车;人没到公司先让让AI买一杯咖啡或奶茶,到地儿了就能取;下班了懒得打字,可以动动嘴就打车回家,或是搜罗附近推荐的餐馆、电影院等。
针对旅游人群及车主,支小宝可根据用户的时间、价格等特定需求,几秒内快速查询机票或火车票;可以根据实时位置,精准查询附近最近的充电桩、加油站和停车场,并能智能定制当地的旅游攻略。
在便民生活、医疗健康等领域,支小宝也能提供多项便捷实用的服务。比如说句话就可以充话费、查快递、查上月消费、看医保余额、异地就医备案、给亲友转账或发红包、搜寻电子社保卡等。
基于支付宝丰富的服务生态,用户只需要简单说句话,便可唤起海量的极致服务。用户点击首页左下方的“随身口令”按钮,还能快速找到自己最常用的功能,找服务更简单。
外滩大会第一天的支小宝采访间,人头攒动,十几平方米的房间闷热不已。和夏末上海天气一样热的,还有和AI相关的一切。
“支小宝的产品定义到底是什么?商业搜索、语音助手?”
“如何求提高用户的留存率?”
一个接一个的问题,令被访人应接不暇,对于支小宝和支付宝在做AI时的选择,大家有太多想要了解。
ChatGpt横空出世后,大模型浪潮随之呼啸而来。人们开始好奇,中国的科技互联网土壤能长出什么样的AI应用?
去年以来,支付宝依托蚂蚁百灵大模型能力,面向民生服务、医疗健康、出行文旅等行业开放了AI行业解决方案。
现在,支付宝交出了一份更完整的答卷,在外滩大会上正式推出支小宝,这个拥有服务执行能力和智能陪伴能力的AI生活管家App。
对于ChatGpt 这样的语言类大模型来说,对prompt 的准确性要求很高,即与大语言模型进行交互时提供明确的指令,并通过反复训练才能得出理想答案。很多时候,prompt甚至可以成为一种与AI模型交互的“编程语言”。这往往意味着使用门槛较高。
在科技企业介入后,通用大模型爆发,同时我们看到了很多不同形态的AI应用:
钉钉上线“AI超级助理”,可调用钉钉几乎所有功能;
微软将Copilot(AI助手)嵌入Word、Excel等旗下办公应用;
苹果推出Apple Intelligence(苹果智能),将AI与Siri结合……
这些探索,包括支付宝推出支小宝,都显示了AI浪潮的另一种方向:不是推倒重建,而是将AI融入原有的平台,服务用户原本就存在的需求。
还是点咖啡的例子,从唤起到购买,解决的是入口问题和商业闭环,但支小宝神奇的地方在于具有场景感知能力,根据用户的日常习惯及使用场景,智能推荐专属的服务。
“比如想点一杯咖啡,支小宝根据用户习惯,和所在的地点特征,会主动推荐你习惯的口味;或是当你到了黄山,会自动推荐AI导游、快速订票等服务。”
用户主动使用的次数越多,支小宝就会越懂你。每个人的生活习惯和需求都是独特的,推动大模型从通用能力走向个性化应用,成为AI行业的核心命题之一。
和支小宝管家熟悉之后,用户就会变得愿意去分享自己的计划和习惯。“一个不爱晒太阳的人,让支小宝推荐周末出游地,它肯定不会推荐爬山;告诉支小宝今天要多喝水,它就会根据你的习惯和健康需求来提醒你喝水。”
王翼飞表示,让人人都拥有专属的AI生活管家,想我所想,办我所办,正是支小宝努力打造的目标。
大模型不是一切,但它能真正智能地调用一切。这些“一切”在那些已融入生活的国民级产品和它已服务的万千复杂场景里。
“内生”于支付宝,这是支小宝的天然基因。对于支小宝来说,这就意味着不止于All in AI,而是AI in All。
互联网平台拥抱AI,是个具有挑战性的系统性工程。
从纯技术衍生的轻量工具产品,向有具体落地场景的深度产品融合演变,除了模型技术、参数、训练数据、训练方法之外,还需要靠谱、具有可行性的应用场景和可持续的生态,以及作为“燃料”基础的优质大数据,比如医疗、政务领域的专业知识和数据。
中国的互联网不缺大数据,但建立在大参数模型和巨量数据展现出来的AI应用,对数据的真实性要求严格。
比如,由于抓取平台数据语言类大模型在回答问题时,答非所问或编造答案的情况并不少见。这样的情况会导致用户的信任感及和服务的可信度都成为问题。
与支付宝深度绑定,足以保证支小宝在数据真实性和安全性上有保障。选择支小宝的模式也表明,支付宝不追求大模型包打天下,更追求让AI回归服务属性。
从风格上看,这背后是支付宝的一贯态度——不追求聊天上的花哨,更追求落地应用的务实;不追求一枝独秀,更追求生态共建的开放升级。
从支付宝诞生开始,它的定位就是服务老百姓,串起千巷百户的大小商家、生意人。这是支付宝成为国民App的基础,但一方面也造成了支付宝功能庞杂的问题,一些应用入口隐藏较深。
在小红书上,用支付宝挂号、缴费、汇率换算、拍证件照等“攻略”层出不穷。明明都是“宝藏”功能,却因为支付宝功能太过大而全,App 页面展现有限,生生被埋没了。
支小宝的出现,相当于让平台服务“瘦身增肌”,让支付宝用户能轻装上阵,探索一种让生活服务更简单和智能的新模式。
过去两年,蚂蚁以支付宝为核心加速AI应用布局,并在出行、政务、医疗、理财等场景都接入了AI,累计服务了亿级用户,百灵大模型的日均调用量超2亿,日均处理千亿级Tokens。
蚂蚁的“AI First”战略,也并非仅停留在支小宝,将AI深度应用于内部场景后,还在加速探索AI原生应用与智能体生态——
面向C端用户,除了生活管家“支小宝”,还推出了AI金融管家“蚂小财”、AI健康管家等;
面向行业,支付宝启动智能体生态开放计划,并推出智能体开发平台“百宝箱”。
此前,支付宝通过开放能力,已联合行业推出一系列的智能体:浙江卫健委“安诊儿”、上海市第一人民医院“公济小壹”、长沙政务服务平台“我的长沙”、江西赣服通数字人客服“小赣事”等。
开放的智能体生态,是新商业时代的服务载体,但如同移动互联网时代的小程序一样,这不是一朝一夕能建成,也不是一己之力能承担的。
支付宝启动智能体生态开放计划,正是希望通过开放流量、行业解决方案、智能体开发平台的能力等,助力更多商家机构,一起推开智能体商业时代的大门。正如蚂蚁集团总裁韩歆毅在这次外滩大会上表示的那样,支付宝开放生态已全面进入 AI 时代。
中国拥有足够大的用户规模,中国各行业的数字化转型有强烈需求,这是中国发展AI的天然优势与支撑。大模型可以极大降低智能体的开发成本,让边际成本趋零,让无数普通人和千行百业都能用上AI,让昂贵高冷的服务走向大众化。
AI长出“手和脚”,走入寻常百姓家,这或许是我们更期待的方向。
文章来源“晓曦”,作者“晓曦”
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales