大模型颠覆一切,终于还是颠到了本小编头上。
还是一个一句话就被打造出来的Agent。
像这样,抛给Ta一篇文章,不到1秒,标题建议就新鲜出炉了。
这效率,比起本人类,只能说是一个快如闪电一个慢如树懒吧…
更难顶的是,创造这个Agent,真的就是几分钟的事。
Prompt是酱婶的:
并且,如果你也想体验这种颠覆一切的feel,现在,基于这个百度刚刚上新的文心智能体平台,人人都能免费打造属于自己的智能助手。
还能通过百度搜索、小度智能硬件平台、文心一言、地图、车机等百度移动生态分发渠道,让更多人用上你的创意!
李彦宏本人,就在Create2024百度AI开发者大会现场亲自来了次手把手教学。
为索菲亚全屋定制打造一个专属商家智能体,只需4步就能快速实现。
数字形象和声音也能一键生成,完成后直接通过百度搜索上岗干活。
好家伙,看这架势,低代码已经不算啥了,零代码打造的智能体,那真是能分分钟改变工作流的节奏。
难怪李彦宏会说:
人人是开发者的时代已经到来。
老规矩,我们还是具体来扒一扒这个Agent Builder是什么、怎么用。
顾名思义,Agent Builder就是基于文心大模型4.0能力的智能体构建平台,中文名字叫“文心智能体平台”。
百度是业内最早布局智能体的大厂之一。2023年9月,百度发布“灵境矩阵”文心一言插件生态平台,同年12月升级为“灵境矩阵智能体平台”。
在今天的Create大会上则升级更名为“文心智能体平台”,支持海量工具调用,还能够完成实时数据调优;并且背靠百度生态分发,能让零代码基础的个体轻松实现“创建-分析-调优-分发-经营数据分析”全链路创作经营,高效实现经营闭环。
上线7个月以来,已有5万多开发者加入,创造出3万多丰富多样的智能体,已有超1万家企业创建了智能体。
在4月16日下午举办的分论坛AI智能体开发与应用论坛上,百度副总裁、百度搜索总经理赵世奇也进一步解读文心智能体平台。
赵世奇表示,文心智能体平台已经可以实现“一句话开发智能体”。
也就是说,即便完全没有编程经验的普通人,也可以凭借自然语言生成专属智能体。在文心智能体平台中,一个账号最高可以创建50个智能体,单个智能体还可以承载10个数据集。
核心能力,就是面向所有人,包括完全不懂代码的非技术人员,提供低门槛甚至零门槛的智能体开发方式。
整个过程,可以简单理解为:
文心大模型通过拆解你输入的功能需求,可以在完全不输入任何代码的情况下,打造具有以下特点的智能实体。
以最吸睛的“零代码”开发为例,在一句话提示的基础之上,文心大模型4.0会自动帮忙生成更为详细的指令。
还可以引入专业领域的知识库、搜索增强等插件,来进一步提升智能体的能力。
值得一提的是,文心智能体平台还提供了数字形象生成能力,上传一张照片,就能自动生成具有语音对话能力的数字人形象。
而面向更专业的开发者,文心智能体平台目前还提供了低代码的开发方式,可以通过拖拽方式快速搭建业务流,结合大模型、知识库、工具等组件,完成智能体开发。
如此打造的智能体究竟能力几何?
现在,在官网体验中心,已经有不少智能体可供参考。
既有创意类型的各种“绘画大师”,也有能直接上岗工作的“新媒体小编”,创作、娱乐、职场、学习、生活等各个垂类均可覆盖。
比如“知乎回答器”,回答起知乎热榜问题是酱婶的:
“小红书文案创作”,也能把小红书风格稳稳拿捏。
2024年,基于大模型的应用创新,已经势不可挡。
而就像李彦宏所说,“人人可AI的理念”,更成为这股大模型颠覆一切的浪潮中,与历史科技变革尤为不同之所在。
文心智能体平台这样的平台应运而生,正是在给创新和开发提供肥沃土壤——多种种类、行业、能力的开发者都能入驻。
拥有开发能力的个人、组织,可以自主开发Agent、插件;不懂代码、0基础的菜鸟小白,可以轻松运用零代码模式,辅助以多样化工具插件,把想象中的Agent变为现实。
创新门槛大大降低,故而各个垂直行业的新式开发者都能入驻文心智能体平台,共建基于大模型的行业矩阵生态,岂不妙哉?
光说不练,假把式。
什么概念啊,设想啊,压根都不是关键,百度Create大会现场,李彦宏直接甩出了文心智能体平台的更为明确的商业化实践案例,来自新加坡旅游局。
作为新加坡旅游局的智能在线分身,它的功能全包含在限定的prompt里了:
你是新加坡旅游官方助手,为人们提供最新、最合适的旅游方案,解答各类新加坡相关问题,并且能提供酒店预订、门票购买等一站式服务。
创建好后,如果百度一下,问“什么时候去新加坡人最少”,该新加坡旅游局Agent就会经由以下步骤:
理解问题——拆分任务,获取多个渠道的信息——思考和决策——给出简单明了的答案。
同时,拿它当一个新加坡旅游实时客服也没在怕的,做一个妥妥的“伸手党”,问他要景点攻略、酒店推荐、帮订门票,都是手拿把掐。
像新加坡旅游局这样的文旅类Agent,和其它知识类、创作类、学习类、生活类智能体一起,都是由企业伙伴、专业行家、新手小白们创建和可利用的。
但和量子位一起长期追踪AI 2.0时代的朋友们应该能注意到,从去年OpenAI发布GPTs功能开始,国内外集成Agent的平台出现了涌现式爆发的情况。
想要挑选一个称心如意的Agent平台,难以抉择的程度真的不亚于《甄嬛传》四郎翻牌子(?)。
文心智能体平台搬出了一个箩筐,一条一条展示,自己是怎么在技术实力、开发设计、分发渠道、运营维护、商业变现方面,统统都干、统统干好,最终使得自己在众多Agent平台中杀出重围的。
首先,技术底座就很稳。
出身百度,文心智能体平台自然背后是自家的文心大模型EB4.0。
作为最早下场押注大模型的大厂之一,百度对大模型长期的巨大投入保证了其技术实力,每个用户上手体验的都是构建Agent的实力派。
其次,在文心智能体平台上造一个新Agent,步骤简单,功能还十分齐全。
步骤简单,是说人话、零代码就能“鞭策”AI搞定每一个Agent的基础配置,只要有灵感,想象就能变成现实。
功能齐全,百度官方联手有大量行业合作伙伴,提供各式各样的专业工具,还支持开发者调用自定义插件实现指定功能,从而让开发者能够比基础配置更上一层楼。
更别提它具备的数据集接入能力,支持大容量、多格式、多途径接入,满足专业或特定智能体构建。
最最不容忽视的一点,文心智能体平台背后是一整个百度生态。
如它声明,文心智能体平台本身定位就不是一个纯开发平台——说起来,更像是个覆盖“开发+分发+运营+变现”的一体化赋能平台。
如前面所说,目前已打通百度搜索、小度智能硬件平台、文心一言、地图、车机等多场景、多设备。
赵世奇还现场提到了平台数据飞轮的优势:
百度多样化的分发场景,可以帮助智能体获得数据反馈,使得模型自主调优,让我们的智能体更聪明。
可以想象,在百度,当海量的数据飞轮转起来了,迭代的速度将是指数级的。
此外,为了更好地服务文心智能体平台的用户,百度搜索还正式发布了“揭榜计划”。
即向行业领先的开发者定向发放英雄帖,覆盖文创、图创、教育、旅游、国学等多个领域。开发者有机会获得揭榜计划的流量、模型、服务、工具和品牌曝光等权益。
我们正见证着一个全新的时代的到来。
在过去,技术高墙往往使得只有少数专业人士才能接触到先进的技术和工具,但如今,随着用户友好型软件和平台的普及,普通用户也能够轻松地使用这些工具来实现自己的想法和创意。
众人拾柴,创新的速度也千百倍于以往。
以此为背景,对资源和能力整合的重视也前所未有。不再仅仅依赖内部资源,而是通过整合外部资源来增强自身的竞争力——这也促进了跨行业、跨领域的合作,为创新提供了更多的可能性。
值得注意的是,由于技术门槛的不断降低,生产过程变得更加灵活智能,个性化和定制化也成为可能。
技术平权趋势下的种种加持,现实变得如赵世奇在Create大会上的演讲一样:
大时代没有小人物,每个人都能是“超级个体”。
找准支点,使用最适合的杠杆,每个人都有可能成为“超级个体”,而文心智能体平台,就是这样的支点和杠杆。
于是,基于大模型技术,文心智能平台这样的平台应运而生。
的确,利用文心智能平台这类AI工具,每个人都能增强自己的劳动力和生产技能,甚至在某些领域达到甚至超越传统公司的能力。
从某种意义上来说,超级个体代表了一种新的工作和生产方式,这种方式更加灵活、高效,并且能够充分发挥个体的创造力和潜能。
比如,AI 2.0时代,以Midjourney为代表的规模很小的AIGC公司,能够创造很高的市场估值,以及市场与用户都认可的实用价值。
再比如,算力的提升和数据的积累已经成为推动算法优化和模型训练的基础要素。
然而,创意在这一过程中扮演的角色同样不可忽视,它如同算力和数据一样,成为了这个时代的关键资源。综观文心智能体平台承载的所有Agent,无论什么行业,无论什么种类,若无创意的光芒照耀,一切将黯淡无光。
超级个体时代,我们手握AI技术面对的,不仅是一场技术的革命,更是一次个体可能性的全面释放。
文章来自微信公众号“QbitAI”,作者 量子位
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales