构建AI Agent有三步:第一步,专家知识的数字化;第二步,支持更多模态的交互;第三步,领域知识的循环沉淀。
2分钟在电脑上“拖拉拽”出一个“项目经理”,AI Agent让这种魔幻成为现实。
从OpenAI研究员Lilian Weng的一篇贴文引爆创业热潮,到被比尔·盖茨预言将颠覆软件生态,毋庸置疑,AI Agent是今年最热门的AI应用探索方向。
所谓基于大语言模型的AI Agent,可以被简单视作可以自主使用系统工具执行任务的智能体。Lilian Weng的贴文指出,“大语言模型、记忆、规划、工具使用”是AI Agent的四个关键组件——有了后三者的能力,大模型就不再只是一个ChatBOT,而能在工作、娱乐等更广阔的场景中发挥价值。
在澜码科技CEO周健看来,AI Agent在To B场景中的最大价值是“复制专家的知识”。成立于2023年2月,澜码科技基于大语言模型的驱动,从而为企业定制研发“中间层” 的自动化运营中台,提供低代码/无代码的人机交互界面。
此前,周健曾担任RPA(机器流程自动化)厂商弘玑Cyclone的CTO。RPA已经初步证明了用“拖拉拽”组件构建自动化办公流程的市场需求,但周健发现,RPA的实操过程中,由于员工缺少专家的经验,人和系统之前仍然存在操作的真空,比如业务流程到底是怎样的——这块知识的“空隙”仍需要人力去填充。
而AI Agent的出现恰好可以弥合空隙。基于企业知识库进行训练,Agent既可获得对业务的理解能,并可自主执行任务。而随着企业知识库的不断更新,Agent的理解能力也会一起更迭。
2023年12月20日,澜码科技发布了自研的AI Agent平台AskXBOT。AskXBOT由设计器、知识中心、使用端、管理平台四大核心模块构成,为企业提供文档检索、AI调用、数据查询、智能编程等基础能力。
AskXBOT。
基于设计器,企业可用预置的多种Agent模板创建Agent,用时可缩短至2分钟左右。同时,工作流设计器上集成多模态模型能力、封装常用能力的各种组件,支持用户使用拖拉拽的方式,定制AI工作流。而基于知识库,企业可对专家知识进行数字化管理和沉淀,并用于Agent训练。
使用AskXBOT创建AI Agent。
AskXBOT的使用端不仅支持自然语言交互(LUI),还支持表格(GUI)等多模态形式的交互形式。周健告诉36氪,LUI仅仅是开始,随着模型能力的提升,支持多模态的CUI(以命令行Commad Line为交互界面)将会成为主流。
管理平台则支持企业对内部的Agent与工作流进行查看和管理,并允许企业对外开放Agent和工作流的API,并对API的调用记录进行查看和管理。
“数字化是智能化的前提。”在周健看来,如果没有把专家知识数字化下来,那么AI Agent的落地会有很大困难。他认为,构建AI Agent有三步:第一步,专家知识的数字化;第二步,基于CUI(以命令行Commad Line为交互界面)的交互;第三步,领域知识的循环沉淀。
第一步是积累Agent的训练养料——数字化的专家知识;第二步则是根据业务需求建立更弹性多元的人机交互方式;第三部则最为重要——周健对36氪强调,在AskXBot的操作环节中,最有价值的是积累数据,形成飞轮:
“在今天大语言模型时代,专家可以通过有限成本,介入业务过程,收集到过程数据,并通过进一步的分析,更快的完成数据飞轮,提高整个业务敏捷的程度。”
文章来自于 36氪“周鑫雨”,作者 “周鑫雨”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT