AI爆发至今,业内普遍流行一句话:AIGC的尽头是AI智能体,但时至今日,大家对AI智能体的理解还比较浅,很多人依旧认为AI智能体离自己还很远。主要是市场上好用的智能体平台并不多。用户关心的是AI到底如何改善工作流,AI到底怎么落地具体的应用场景?或者AI到底是怎么帮我们干活的?
这里不得不提到免费和可以白嫖GPT4.0的Coze,但Coze突然简单粗暴地开启了收费,价格还不便宜,很多人瞬间就觉得Coze不香了。
自8月15日起,Coze将启动收费模式。这一消息对于广大用户来说,意味着一个全新的开始。
作为智能体的重度用户,我开始寻找免费的替代品,说到这里,一则新闻映入眼帘,2024年7月5日起,百度文心智能体平台(AgentBuilder),免费开放文心大模型4.0,开发者在文心智能体平台上制作智能体时,可灵活选择文心大模型3.5或4.0版本,且近期还上线了许多实用的新功能。
文心4.0版本的免费开放,大大提升了文心智能体平台的能力边界。百度文心大模型4.0是迄今为止最强大的中文大语言模型,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有着显著提升,综合能力已经达到GPT-4的水平。
文心智能体平台可以免费以文心4.0为基座来创建自己的AI智能体,不论如何都要试上一试。
文心智能体平台官网:https://agents.baidu.com/center
接下来我们从不同角度来介绍文心智能体的重要功能,有不少是Coze不具备的。
1、创建智能体
首先我们进入上面提到的文心智能体官网,点击创建智能体,百度提供零代码和低代码两种构建方式,零代码是面向产品、UI等不太懂技术的人群使用,百度老板之前说的“人人都是开发者”,这里我们首选零代码方式。然后输入智能体的名字和角色设定。
很多朋友不知道怎么写出好的提示词,AI可以来帮忙,我们今天就来做一个生成Prompt的智能体。
创建之后输入智能体的名称和设定,点击立即创建。然后就是自定义详细配置创建的智能体的功能,一定要记得勾选右上角的文心4.0。
然后点击发布就可以了。是不是特别简单?关于智能体详细配置的具体功能,我们跟你娓娓道来。
2、分发渠道
文心一言的智能体可以一键发布到微信公众号平台和企业微信,还能支持网页链接、小程序和API调用,这简直是开发者的福音。
我们选择订阅号,点击绑定,使用绑定的公众号的管理员账号扫码授权就可以了,然后点击发布。
发布完成后,提示如下信息,优秀的智能体甚至有希望上百度搜索,文心智能体集成了在线搜索功能,这个我们晚点讲。
发布完成后等待平台审核,从我的体验来看,24小时内就能审核通过了。从整个过程来看,不论是创建智能体还是发布第三方平台到亦或是审核,整个过程非常丝滑,非常自然,没有任何卡点。
3、知识库系统
知识库是很多朋友想要的功能,在自己的公众号对话框里能及时获取与自己相关的介绍,能够大大节约与用户的沟通成本。文心智能体可以支持上传100个文件,通过本地上传,网络访问或者百度网盘的方式进行。
其中,支持百度网盘这一功能,对于习惯使用百度网盘做工作盘的宝子们来说,真是太幸福了。目前为止,我还没有发现哪个智能体平台能支持百度网盘。
授权过程非常简单,如果你的电脑上安装了百度网盘或者之前登录过网盘的账号,点击授权后它会自动关联,然后只要再点一次鼠标,授权即可。授权后即会展现出所有的百度网盘里面的文件,你只要勾选即可,非常方便。除了文本文件,文心智能体还支持上传网盘的图片、音频、视频文件,完美地展现了它的多模态能力。
百度在互联网深耕多年,拥有包括搜索平台、文库平台、网盘、云计算、百度音乐等多种布局生态,做多模态的文心智能体水到渠成。
4、数字形象
百度的智能体还能自定义数字形象和声音克隆,还记得前不久很火爆的"AI男友半夜陪我敲邻居家门"解决楼上邻居噪音问题的视频吗?
AI不但能帮忙与邻居对话,还能唱生日歌,这真是太棒的体验了。有种科幻的即视感,文心智能体统统做到了,从我的实际体验来看,它丝毫不输任何一个智能体平台。
首先,在高级配置中,我们把数字形象的开关打开,可以选择系统中的公共形象,也可以自己上传一张照片做数字形象,这里我选择了一张AI女孩做我智能体的数字形象。
文心智能体还支持一键将数字形象自动用作头像,真是太贴心了。
功能说明
在声音克隆这块,文心智能体也充满人性化,在高级配置中可以选择系统自带声音,也可以选择自己添加声音。
文心智能体的系统自带声音非常丰富,百度还用了不少名人的声音,可见是下了血本。这里我们也可以选择添加自己的声音,点击“添加声音”后,按照系统提示念一段话就好,相当简单、方便。
使用自定义声音做智能体,能带来一种全新的体验,大多数人对充满磁性的声音没有抵抗力,所以,声音本身是优秀智能体值得下功夫的重要元素,不过要记得在相对安静的环境中进行录制哦。
5、工具集成
文心智能体还支持多种工具集成,包括在线搜索增强、文生图、文生表、文生代码等等,还能无缝地集成百度地图、景点酒店查询等实用功能,其中很多都是百度自己的官方产品或能力,这得益于其优秀和庞大的互联网生态布局。
部署的方法也很简单,完全有手就会,在高级选项的工具选项中点击添加工具,展开后,直接点右边的小框框,点确认即可。
6、总结
专注于细分市场的AI智能体被设计来精准地满足特定群体的需求。这些智能体代表了个性化服务的新趋势。比如文心智能体下面这个"00后的疯感工位牌生成器"就很具有代表性,成功地吸引了许多00后进去一观究竟。我在本文的阅读原文中放上了这个智能体的链接,感兴趣的朋友们赶紧点进去体验体验吧。
文心智能体平台除了拥有丰富、强大的自定义功能,还和市场上热门的IP联合。热门IP本身自带流量,这从另外一个角度讲,文心智能体自掏腰包给广大用户投流了。
最近,爱奇艺推出的古装悬疑剧《唐朝诡事录》第二季——《唐朝诡事录之西行》备受瞩目,为了增强观众的互动体验,文心智能体与爱奇艺携手,利用剧中角色的特点和剧情元素,特别开发了相关角色的智能体。
现在,只需在百度上搜索《唐朝诡事录之西行》,就能与这些角色进行互动,共同揭开剧中的谜团,创意十足。
这么一个生态丰富,能力突出还免费的优秀文心智能体平台,你还能什么呢?建议,直接冲!
文章来源于“指间光年”,作者“指间光年”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】MockingBird是一个5秒钟即可克隆你的声音的AI项目。
项目地址:https://github.com/babysor/MockingBird
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0