「目前AI像一个练习生,练习生的概念是重金出道,还没有真正走进生活。」「支小宝」App发布后的沟通会上,主持人这样说道。
这是一个能够准确描述当下AI应用落地现状的比喻。一方面,从业者都相信生成式AI能给行业带来生产力级别的改变,越来越多的企业开始将目光瞄向生成式AI的落地应用;另一方面,生成式AI对大众而言还是熟悉的陌生人,新进展、新应用让他们应接不暇,但并没有出现一款能快速打爆市场的国民级偶像产品。
新技术与需求场景的结合可能需要更多时间,新产品与大众用户的磨合也需要更多时间,绝大部分AI创新产品都还没有摆脱「从尝鲜到放弃」的沉没循环。这种探索模式下,AI练习生中出现了一批脱胎于移动互联网头部产品的「星二代」,包括但不限于支小宝、文小言、知乎直答等。
它们肩负着延续和探索的双重责任。在从移动互联网时代过渡到到AI时代的过程中,这些二代产品继承了老一代产品的能力积累和需求洞察,并在此基础上,结合生成式AI的能力,围绕原来的目标场景进行创新探索,目标是寻找适合AI时代的产品形态。
一个最新的进展是,知乎直答在10月31日上线了「专业搜索」功能。这个功能引入了维谱、知乎精选等专业内容源,同时支持文件上传和超长文件解析。利用该功能搜索「大模型幻觉出现的根本原因」时,一部分参考资料会来自期刊论文。百度也被认为将在百度世界2024公布AI搜索的新进展。
但这些可能依然不是标准答案。在技术变革带来的时代更迭中,头部产品如何跨越周期是时代叙事的重要组成部分。拥抱移动互联网的过程中,我们见证了微信的诞生、发展和壮大,也看到了阿里如何「all in 无线」,打造出手机淘宝这个航母级产品。AI时代的到来,让人们有理由期待更激动人心的蜕变故事的出现。
特别是,生成式AI驱动的新一轮产品架构、交互方式、用户体验设计,甚至商业模式的变化,其颠覆性可能会更甚于头部App的移动化。独立于上一代产品的身份会让二代产品有更大的灵活度和操作空间,去适应更具颠覆性的创新探索。这也正在成为头部产品AI能力产品化的一条曲折但重要的路径。
知乎直答发布于6月29日,文小言在9月4日由文心一言升级而来,支小宝在9月5日的外滩大会上被正式推出。从日期来看,这些升级和发布更像是分别对知乎、支付宝、百度搜索的AI化探索进行了一次阶段性总结。
知乎今年3月就在App内上线了「发现·AI搜索」功能,基于知乎的内容积累,为用户提供新搜索、实时问答和追问等体验,提升问答社区的便捷性和有用性。知乎创始人、CEO周源在2024年第一季度财报电话会上表示,「发现·AI搜索」功能推出后,知乎平台的用户留存率和用户参与度(使用AI搜索功能的用户数量)均实现了两位数的增长。
知乎方面认为,「发现·AI搜索」作为知乎在AI搜索领域的一次尝试,验证了可行性,明确了知乎做AI搜索的优势是拥有大量优秀的专业创作者,并且形成了一定的用户心智。在此基础上,知乎直答在知乎第十届盐Club新知青年大会被正式推出,成为周源口中的全新生产力工具和发现世界的连接器。
知乎直答推出专业搜索能力,是对周源这一观点的延续。我们从中可以看到,知乎在持续优化工具,提升用户的专业知识获取效率;同时让用户能够通过参考来源,直接预览维普上的期刊论文内容,实现对专业内容源的拓展和连接。
支付宝推出支小宝的情况与知乎直答相近,也是在支付宝App内部进行了一段时间的探索与验证之后,才推出了独立产品,被称为「支付宝生的小宝」。2024年4月,支付宝在首页开始测试支付宝智能助理,主要聚焦生活办事,实现App内部的智能导航,让用户通过对话交互快速找到出行、健康、政务、金融等领域的服务。
在平台内部进行的AI探索基础上,支付宝推出了独立的AI原生应用支小宝。这个产品以自然语言交互为核心,界面设计更简单,能够直接唤起支付宝的生活服务,实现一句话打开地铁码、购买咖啡等行为。同时,支小宝还会存在于支付宝的端内,用户在首页下拉就能找到并体验支小宝的功能。
「整体的逻辑上,底层是一致的。今天有一波用户已经习惯了支付宝,他们认为我不需要一个新的东西,我们把这个选择保留给用户;如果想要有不一样的AI体验,或者年轻一点的用户想做新的尝试,我们非常欢迎他们使用支小宝。」支付宝智能助理产品负责人王翼飞表示。
相比知乎直答和支小宝,由文心一言升级而来的文小言上线之初就是一个独立产品。文小言依托百度的AI能力和搜索生态,尝试构建一种面向未来的「新搜索」体验。在百度副总裁、AI产品创新业务及MEG战略运管中心负责人的薛苏的介绍中,「文心一言变成文小言,是希望小言走入我们生活中,不仅是工具,还是我们资深的朋友,还是陪伴的智囊和知己。」
相比一年前发布的文心一言,文小言除了具备搜索基本的信息检索能力,还能够记住用户的兴趣爱好,根据需要为用户推送订阅信息,还可以和用户聊最新的热点事件。这种变化也迎合了百度创始人李彦宏的一个判断,即超级能干的应用比只看DAU的超级应用更重要。
二代产品的出现,是巨头们用AI升级和重构刚需场景的一次积极尝试。对于一款头部应用而言,在通向AI时代的路径尚未足够清晰的当下,利用二代产品来进行重构体验的创新探索与用户测试,可以大大降低创新的风险成本。
同时,相较完全独立的创新产品,背负「历史包袱」的二代产品会有更明确的、与原有生态关联更密切的成长目标。
比如,AI与搜索的结合是一个必然会发生的趋势,但是,搜索业务是百度生态的根基,实现整体的AI化转型需要更加审慎。就像李彦宏所说,搜索业务的历史沿革和员工观念转变需要时间,让整个转型的进程变得相对缓慢。
这种情况下,百度需要文小言作为搜索创新的试验田。「文小言在百度的大生态中,扮演了其中一个敢于往前走的先锋的角色,有更小的负担,也有更AI原生的背景。」薛苏表示。通过文心一言到文小言的升级,百度对新搜索做出了进一步诠释。
在薛苏的介绍中,文小言的新搜索将包括搜、创、聊三部分。作为基础的搜,要做到快、准、专业、广覆盖、多模态;创则是利用生成式AI的能力,让用户在搜索结果基础上,实现简历生成、拍照解题、修图等创作效率的提升;聊则通过拟真数字人赋予新的陪伴体验。然后通过个性化记忆和自由订阅等功能创新,让搜索与人性化的助手实现融合。
基于自然语言实现的搜索交互体验,以及搜索与创作的融合,是未来的主流趋势。百度围绕文小言进行的探索在沿着这条路径前进。想要在这条路径上走得更远,百度还需要让大模型有更深度地思考能力,为搜索引入更多专业内容源,有更丰富的自动化执行功能。相较而言,虚拟人对搜索体验的提升反倒没有很大效用。
支付宝对支小宝的定位也是助手,一位基于支付宝服务生态产生的AI秘书或生活小管家。作为一个融入许多服务和连接线上线下的平台,支付宝上聚集了大量的服务能力,但在传统的交互方式下,一部分用户会面临难以找到合适服务的情况。基于生成式AI提供的更强大的自然语言交互能力,支付宝能够搭建起一个找服务的快捷通道。
当然,支小宝在自然语言交互下的探索并没有局限在服务的分发层面,而是已经开始拓展更多AI原生功能,比如规划行程并主动设置提醒,以及基于ACT(Transformer for Actions)的智能服务技术实现的智能点单。这一技术能够让支小宝具备屏幕感知与仿真执行能力,用户说一句话,就能完成以往需要多次点击才能实现的操作。
「我们有一个判断,特别单点的需求,其实无法激发『管家感』。但当它能帮你做好3件、5件,乃至更多事情,并且有一定频次的时候,用户才在内心承认,它是一个管家。今天我觉得需要聚焦的那个点,一定是要有场景的,有记忆能力的,能理解用户的,由哪几个场景构成,这是接下来讨论和摸索的地方。」蚂蚁集团大模型应用部总经理顾进杰说道。
知乎直答则是利用对话,降低了普通用户的提问门槛,并将社区内大量专业答主的真实回答和高质量语料数据应用于AI搜索场景,在站外内容的辅助下,生成更具知乎专业属性标签的答案。在使用过程中,可以发现知乎直答可以给到很多小众问题比较精确的回答,比如答出com.apple.MCX.plist是什么文件;专业搜索的结果更扎实,但目前会有一些参考来源出现文不对题的情况。
二代面向场景的摸索,是AI产品化能力支持下的生态之争。一方面,二代产品调用的依然是原有生态的基础资源,百度的搜索、知乎的问答、支付宝的服务,都是这些企业在移动互联网阶段积累起来的核心能力。
「知乎直答和知乎是密不可分的。首先,直答的内容大部分源于知乎社区。直答能有如此优秀的质量,除了模型和工程上的努力外,内容是最宝贵资源。直答源于社区,也希望反哺社区。第二,直答是AI搜索工具,通过全新的信息获取方式,极大地提升了搜索效率。」知乎方面表示。
围绕AI,知乎持续在做两件事:一是思考AI能为社区做什么;二是探索社区+AI能产生出什么新的产品形态。知乎对知乎直答的期望不仅仅是通过AI搜索工具激活社区内容的沉没价值,还想要在AI搜索与问答社区生态的融合中,找到进一步激活社区的抓手。从知乎直答上,我们可以看到AI有放大用户、内容、创作者之间连接的能力。
另一方面,AI产品化能力的强弱,既取决于对技术的理解,也受限于场景认知的深度和广度。在AI时代,很多场景认知和方法论,都会被凝练在不同的智能体中,由AI按需调用,帮助AI产品实现场景深度和广度的拓展。
相较知乎的问答生态,百度和支付宝面临的需求场景会更为复杂,在他们的生态中不仅聚拢了大量内容,还有集合了丰富的服务与体验。智能体让文小言和支小宝具备了灵活调用复杂生态积累的能力。
「智能体的互联互接是未来商业的新可能性,原来小程序基于表单来收数据,可能没办法做到很多服务的智能推送,智能体重新做了服务信息匹配和焕新。」顾进杰表示。相比只能实现简单功能的小程序,智能体具备一定的主动性和决策能力,可以依据对需求、场景的理解,主动规划和执行多步骤任务。
未来的支小宝可能会是支付宝服务生态与C端用户需求之间的匹配核心。C端用户使用自然语言向支小宝提出需求,支小宝基于AI能力更精准地理解这个需求,然后调用相应的智能体对其进行满足。
目前,支小宝已经与一些旅游景区、文旅机构、商圈等合作,在用户抵达特定区域后,为其推荐特定的空间智能体,提供本地化的AI导游、门票预订、餐饮推荐服务。
在初步的案例展示中,支小宝与空间智能体的结合,能够为用户提供更精细化的管家服务。游客在黄山打开支小宝就能进入黄山空间智能体。这个智能体会在游客购买门票后,为其推送游玩日的景区温度、穿衣推荐和路线攻略;到达景区后,能够自动调取门票二维码,并自动打开AI讲解;走出景区时,黄山空间智能体会自动向游客推荐附近的美食。
百度也在强调智能体对生态能力调用的重要性。薛苏认为,最后为大家提供服务的一定不仅仅是文小言,而是文小言和他的朋友们。「我们称之为一强多专或一全多专。文小言是全知全能地陪在你身边的,最贴心的全科医生,他能解决尽量多的问题,对用户来说路径最短,最方便。但一定会有一些更专业、细分、深度的场景,文小言作为一个全而强的智能助手可能完成得不够好,需要他的朋友们来帮忙。」
「多专」的实现,就需要智能体作为百度生态内更多创作者与第三方机构的连接器。李彦宏认为,搜索与大模型的结合,尤其是通过智能体,将成为未来搜索发展的关键方向。智能体是内容、服务和信息的新载体,百度在这方面的投入是基于对未来潜力的预判。随着基础模型的进步,智能体的进入门槛将降低,但同时其发展潜力也将大幅提升。
AI产品化能力支撑下的生态进化,让产品的灵活性与生态的多样性基于AI技术实现了大幅提升。在AI交互+智能体生态+基础大模型能力的组合中,二代产品正在成为巨头们连接C端用户与生态伙伴的任意门,通过更自然的对话,完成对内容、服务、体验的更精准分发。
也因此,拥有更厚实的生态积累的二代产品,会更容易找到撑起用户认知和市场地位的关键支撑场景。但在找到这些场景之前,二代产品更多扮演的仍然是抢占用户心智的角色。
参与者在市场发展的早期就抢占到更多用户心智,能够为市场拓展争取到事半功倍的效果。大众用户对AI产品的了解远未达到与AI技术相匹配的阶段。这种脱节,会导致用户对AI产品缺乏判断力,做出选择的时候往往更依赖产品在市场上的声量大小。
在实现较好的产品体验基础上,二代产品更容易放大自己的市场声量。目前,文小言是极少的几个月活超千万的AI产品之一。知乎直答在上线之后也保持了访问量的快速增长,SimilarWeb的统计数据显示,知乎直答9月访问量达到470万,较8月访问量增长超180%。
从长远来看,二代产品的前进路径上也充斥着诸多不确定性。就像娱乐圈的练习生一样,拥有资源加持的星二代也只是获得了更低的入局门槛,上一代的成功经验不一定适用于这一代,新的方法论尚未养成,成功的机会依然稍纵即逝。
这也是为什么,被问及「支小宝未来会成为一个超级APP吗」时,王翼飞给出的回答会是:「要交给时间,交给用户选择。」
文章来自于微信公众号 “窄播”,作者“窄播”
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales