ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI练习生里的「星二代」
2714点击    2024-11-05 11:00

「目前AI像一个练习生,练习生的概念是重金出道,还没有真正走进生活。」「支小宝」App发布后的沟通会上,主持人这样说道。


这是一个能够准确描述当下AI应用落地现状的比喻。一方面,从业者都相信生成式AI能给行业带来生产力级别的改变,越来越多的企业开始将目光瞄向生成式AI的落地应用;另一方面,生成式AI对大众而言还是熟悉的陌生人,新进展、新应用让他们应接不暇,但并没有出现一款能快速打爆市场的国民级偶像产品。


新技术与需求场景的结合可能需要更多时间,新产品与大众用户的磨合也需要更多时间,绝大部分AI创新产品都还没有摆脱「从尝鲜到放弃」的沉没循环。这种探索模式下,AI练习生中出现了一批脱胎于移动互联网头部产品的「星二代」,包括但不限于支小宝、文小言、知乎直答等。


它们肩负着延续和探索的双重责任。在从移动互联网时代过渡到到AI时代的过程中,这些二代产品继承了老一代产品的能力积累和需求洞察,并在此基础上,结合生成式AI的能力,围绕原来的目标场景进行创新探索,目标是寻找适合AI时代的产品形态。


一个最新的进展是,知乎直答在10月31日上线了「专业搜索」功能。这个功能引入了维谱、知乎精选等专业内容源,同时支持文件上传和超长文件解析。利用该功能搜索「大模型幻觉出现的根本原因」时,一部分参考资料会来自期刊论文。百度也被认为将在百度世界2024公布AI搜索的新进展。



但这些可能依然不是标准答案。在技术变革带来的时代更迭中,头部产品如何跨越周期是时代叙事的重要组成部分。拥抱移动互联网的过程中,我们见证了微信的诞生、发展和壮大,也看到了阿里如何「all in 无线」,打造出手机淘宝这个航母级产品。AI时代的到来,让人们有理由期待更激动人心的蜕变故事的出现。


特别是,生成式AI驱动的新一轮产品架构、交互方式、用户体验设计,甚至商业模式的变化,其颠覆性可能会更甚于头部App的移动化。独立于上一代产品的身份会让二代产品有更大的灵活度和操作空间,去适应更具颠覆性的创新探索。这也正在成为头部产品AI能力产品化的一条曲折但重要的路径。


二代产品走上舞台


知乎直答发布于6月29日,文小言在9月4日由文心一言升级而来,支小宝在9月5日的外滩大会上被正式推出。从日期来看,这些升级和发布更像是分别对知乎、支付宝、百度搜索的AI化探索进行了一次阶段性总结。


知乎今年3月就在App内上线了「发现·AI搜索」功能,基于知乎的内容积累,为用户提供新搜索、实时问答和追问等体验,提升问答社区的便捷性和有用性。知乎创始人、CEO周源在2024年第一季度财报电话会上表示,「发现·AI搜索」功能推出后,知乎平台的用户留存率和用户参与度(使用AI搜索功能的用户数量)均实现了两位数的增长。


知乎方面认为,「发现·AI搜索」作为知乎在AI搜索领域的一次尝试,验证了可行性,明确了知乎做AI搜索的优势是拥有大量优秀的专业创作者,并且形成了一定的用户心智。在此基础上,知乎直答在知乎第十届盐Club新知青年大会被正式推出,成为周源口中的全新生产力工具和发现世界的连接器。


知乎直答推出专业搜索能力,是对周源这一观点的延续。我们从中可以看到,知乎在持续优化工具,提升用户的专业知识获取效率;同时让用户能够通过参考来源,直接预览维普上的期刊论文内容,实现对专业内容源的拓展和连接。


支付宝推出支小宝的情况与知乎直答相近,也是在支付宝App内部进行了一段时间的探索与验证之后,才推出了独立产品,被称为「支付宝生的小宝」。2024年4月,支付宝在首页开始测试支付宝智能助理,主要聚焦生活办事,实现App内部的智能导航,让用户通过对话交互快速找到出行、健康、政务、金融等领域的服务。



在平台内部进行的AI探索基础上,支付宝推出了独立的AI原生应用支小宝。这个产品以自然语言交互为核心,界面设计更简单,能够直接唤起支付宝的生活服务,实现一句话打开地铁码、购买咖啡等行为。同时,支小宝还会存在于支付宝的端内,用户在首页下拉就能找到并体验支小宝的功能。


「整体的逻辑上,底层是一致的。今天有一波用户已经习惯了支付宝,他们认为我不需要一个新的东西,我们把这个选择保留给用户;如果想要有不一样的AI体验,或者年轻一点的用户想做新的尝试,我们非常欢迎他们使用支小宝。」支付宝智能助理产品负责人王翼飞表示。


相比知乎直答和支小宝,由文心一言升级而来的文小言上线之初就是一个独立产品。文小言依托百度的AI能力和搜索生态,尝试构建一种面向未来的「新搜索」体验。在百度副总裁、AI产品创新业务及MEG战略运管中心负责人的薛苏的介绍中,「文心一言变成文小言,是希望小言走入我们生活中,不仅是工具,还是我们资深的朋友,还是陪伴的智囊和知己。」


相比一年前发布的文心一言,文小言除了具备搜索基本的信息检索能力,还能够记住用户的兴趣爱好,根据需要为用户推送订阅信息,还可以和用户聊最新的热点事件。这种变化也迎合了百度创始人李彦宏的一个判断,即超级能干的应用比只看DAU的超级应用更重要。


场景的升级与重构


二代产品的出现,是巨头们用AI升级和重构刚需场景的一次积极尝试。对于一款头部应用而言,在通向AI时代的路径尚未足够清晰的当下,利用二代产品来进行重构体验的创新探索与用户测试,可以大大降低创新的风险成本。


同时,相较完全独立的创新产品,背负「历史包袱」的二代产品会有更明确的、与原有生态关联更密切的成长目标。


比如,AI与搜索的结合是一个必然会发生的趋势,但是,搜索业务是百度生态的根基,实现整体的AI化转型需要更加审慎。就像李彦宏所说,搜索业务的历史沿革和员工观念转变需要时间,让整个转型的进程变得相对缓慢。


这种情况下,百度需要文小言作为搜索创新的试验田。「文小言在百度的大生态中,扮演了其中一个敢于往前走的先锋的角色,有更小的负担,也有更AI原生的背景。」薛苏表示。通过文心一言到文小言的升级,百度对新搜索做出了进一步诠释。


在薛苏的介绍中,文小言的新搜索将包括搜、创、聊三部分。作为基础的搜,要做到快、准、专业、广覆盖、多模态;创则是利用生成式AI的能力,让用户在搜索结果基础上,实现简历生成、拍照解题、修图等创作效率的提升;聊则通过拟真数字人赋予新的陪伴体验。然后通过个性化记忆和自由订阅等功能创新,让搜索与人性化的助手实现融合。



基于自然语言实现的搜索交互体验,以及搜索与创作的融合,是未来的主流趋势。百度围绕文小言进行的探索在沿着这条路径前进。想要在这条路径上走得更远,百度还需要让大模型有更深度地思考能力,为搜索引入更多专业内容源,有更丰富的自动化执行功能。相较而言,虚拟人对搜索体验的提升反倒没有很大效用。


支付宝对支小宝的定位也是助手,一位基于支付宝服务生态产生的AI秘书或生活小管家。作为一个融入许多服务和连接线上线下的平台,支付宝上聚集了大量的服务能力,但在传统的交互方式下,一部分用户会面临难以找到合适服务的情况。基于生成式AI提供的更强大的自然语言交互能力,支付宝能够搭建起一个找服务的快捷通道。


当然,支小宝在自然语言交互下的探索并没有局限在服务的分发层面,而是已经开始拓展更多AI原生功能,比如规划行程并主动设置提醒,以及基于ACT(Transformer for Actions)的智能服务技术实现的智能点单。这一技术能够让支小宝具备屏幕感知与仿真执行能力,用户说一句话,就能完成以往需要多次点击才能实现的操作。


我们有一个判断,特别单点的需求,其实无法激发『管家感』。但当它能帮你做好3件、5件,乃至更多事情,并且有一定频次的时候,用户才在内心承认,它是一个管家。今天我觉得需要聚焦的那个点,一定是要有场景的,有记忆能力的,能理解用户的,由哪几个场景构成,这是接下来讨论和摸索的地方。」蚂蚁集团大模型应用部总经理顾进杰说道。


知乎直答则是利用对话,降低了普通用户的提问门槛,并将社区内大量专业答主的真实回答和高质量语料数据应用于AI搜索场景,在站外内容的辅助下,生成更具知乎专业属性标签的答案。在使用过程中,可以发现知乎直答可以给到很多小众问题比较精确的回答,比如答出com.apple.MCX.plist是什么文件;专业搜索的结果更扎实,但目前会有一些参考来源出现文不对题的情况。



生态厚度是竞争关键


二代面向场景的摸索,是AI产品化能力支持下的生态之争。一方面,二代产品调用的依然是原有生态的基础资源,百度的搜索、知乎的问答、支付宝的服务,都是这些企业在移动互联网阶段积累起来的核心能力。


「知乎直答和知乎是密不可分的。首先,直答的内容大部分源于知乎社区。直答能有如此优秀的质量,除了模型和工程上的努力外,内容是最宝贵资源。直答源于社区,也希望反哺社区。第二,直答是AI搜索工具,通过全新的信息获取方式,极大地提升了搜索效率。」知乎方面表示。


围绕AI,知乎持续在做两件事:一是思考AI能为社区做什么;二是探索社区+AI能产生出什么新的产品形态。知乎对知乎直答的期望不仅仅是通过AI搜索工具激活社区内容的沉没价值,还想要在AI搜索与问答社区生态的融合中,找到进一步激活社区的抓手。从知乎直答上,我们可以看到AI有放大用户、内容、创作者之间连接的能力。


另一方面,AI产品化能力的强弱,既取决于对技术的理解,也受限于场景认知的深度和广度。在AI时代,很多场景认知和方法论,都会被凝练在不同的智能体中,由AI按需调用,帮助AI产品实现场景深度和广度的拓展。


相较知乎的问答生态,百度和支付宝面临的需求场景会更为复杂,在他们的生态中不仅聚拢了大量内容,还有集合了丰富的服务与体验。智能体让文小言和支小宝具备了灵活调用复杂生态积累的能力。


智能体的互联互接是未来商业的新可能性,原来小程序基于表单来收数据,可能没办法做到很多服务的智能推送,智能体重新做了服务信息匹配和焕新。」顾进杰表示。相比只能实现简单功能的小程序,智能体具备一定的主动性和决策能力,可以依据对需求、场景的理解,主动规划和执行多步骤任务。


未来的支小宝可能会是支付宝服务生态与C端用户需求之间的匹配核心。C端用户使用自然语言向支小宝提出需求,支小宝基于AI能力更精准地理解这个需求,然后调用相应的智能体对其进行满足。


目前,支小宝已经与一些旅游景区、文旅机构、商圈等合作,在用户抵达特定区域后,为其推荐特定的空间智能体,提供本地化的AI导游、门票预订、餐饮推荐服务。


在初步的案例展示中,支小宝与空间智能体的结合,能够为用户提供更精细化的管家服务。游客在黄山打开支小宝就能进入黄山空间智能体。这个智能体会在游客购买门票后,为其推送游玩日的景区温度、穿衣推荐和路线攻略;到达景区后,能够自动调取门票二维码,并自动打开AI讲解;走出景区时,黄山空间智能体会自动向游客推荐附近的美食。



百度也在强调智能体对生态能力调用的重要性。薛苏认为,最后为大家提供服务的一定不仅仅是文小言,而是文小言和他的朋友们。「我们称之为一强多专或一全多专。文小言是全知全能地陪在你身边的,最贴心的全科医生,他能解决尽量多的问题,对用户来说路径最短,最方便。但一定会有一些更专业、细分、深度的场景,文小言作为一个全而强的智能助手可能完成得不够好,需要他的朋友们来帮忙。」


「多专」的实现,就需要智能体作为百度生态内更多创作者与第三方机构的连接器。李彦宏认为,搜索与大模型的结合,尤其是通过智能体,将成为未来搜索发展的关键方向。智能体是内容、服务和信息的新载体,百度在这方面的投入是基于对未来潜力的预判。随着基础模型的进步,智能体的进入门槛将降低,但同时其发展潜力也将大幅提升。


把一切交给时间


AI产品化能力支撑下的生态进化,让产品的灵活性与生态的多样性基于AI技术实现了大幅提升。在AI交互+智能体生态+基础大模型能力的组合中,二代产品正在成为巨头们连接C端用户与生态伙伴的任意门,通过更自然的对话,完成对内容、服务、体验的更精准分发。


也因此,拥有更厚实的生态积累的二代产品,会更容易找到撑起用户认知和市场地位的关键支撑场景。但在找到这些场景之前,二代产品更多扮演的仍然是抢占用户心智的角色。


参与者在市场发展的早期就抢占到更多用户心智,能够为市场拓展争取到事半功倍的效果。大众用户对AI产品的了解远未达到与AI技术相匹配的阶段。这种脱节,会导致用户对AI产品缺乏判断力,做出选择的时候往往更依赖产品在市场上的声量大小。


在实现较好的产品体验基础上,二代产品更容易放大自己的市场声量。目前,文小言是极少的几个月活超千万的AI产品之一。知乎直答在上线之后也保持了访问量的快速增长,SimilarWeb的统计数据显示,知乎直答9月访问量达到470万,较8月访问量增长超180%。


从长远来看,二代产品的前进路径上也充斥着诸多不确定性。就像娱乐圈的练习生一样,拥有资源加持的星二代也只是获得了更低的入局门槛,上一代的成功经验不一定适用于这一代,新的方法论尚未养成,成功的机会依然稍纵即逝。


这也是为什么,被问及「支小宝未来会成为一个超级APP吗」时,王翼飞给出的回答会是:「要交给时间,交给用户选择。」


文章来自于微信公众号 “窄播”,作者“窄播”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

4
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

5
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales