5款预构建Agent、数百万AI协作前景。
智东西11月20日消息,在昨日开始的微软Ignite大会上,微软宣布已建立全球规模最大的企业级AI Agent生态系统。企业用户现在可以通过Azure AI目录访问超过1800个AI模型,用于支持各类AI Agent的部署和运行。
微软的Copilot Studio平台目前已支持用户创建自主Agent,并正式进入预览阶段。同时,微软还发布了5款预构建AI Agent,包括:SharePoint自定义个性化Agent、员工自助服务Agent处理HR和IT任务、Facilitator Agent自动记录会议笔记、Interpreter Agent提供9种多语言实时翻译,以及Project Manager Agent帮助自动化项目管理流程。
此外,微软研究团队近期基于企业Autogen框架推出了Magnetic-One系统,该系统采用Agent等级结构,将管理Agent与专业Agent分工协作,未来或实现数百万AI Agent的无缝协作。
自Copilot Studio发布以来,已有超过10万家企业使用该平台创建或编辑AI Agent。微软的Copilot Studio能够与1400多个企业系统和数据源集成,包括SAP、ServiceNow和SQL数据库等。
一些早期用户已经看到了效果。例如,麦肯锡通过自动流程规划Agent将项目接收流程从20天缩短至2天;Pets at Home在不到两周内完成了防欺诈Agent的部署,年均节省数百万美元。此外,Nsure、标准银行、汤森路透、维珍货币、Clifford Chance和苏黎世等企业也在使用Copilot Studio提升运营效率。
根据国际数据公司(IDC)的预测,在未来两年内,越来越多的企业将会开发定制化的AI工具。从Salesforce和Snowflake这样的科技巨头到CrewAI、Sema4.ai等新兴公司,市场上正在涌现出大量旨在提升企业运营效率的AI平台。
现在,微软的自主Agent已正式进入公共预览阶段,企业可以通过Copilot平台创建并使用自己的AI Agent。
在Copilot Studio中,用户可以通过预设模板(如销售订单处理或交易加速)快速构建自己的Agent;如果需要更高级的功能,还可以使用目前处于预览阶段的Agent SDK进行开发。通过这个SDK,开发者可以打造与微软服务深度整合的多渠道Agent,并将其部署在多个平台上使用。
此外,微软还整合了Azure AI Foundry与Copilot Studio,支持用户自定义知识库(目前为预览版)和自带模型(目前为个人预览版)。这意味着用户可以利用自定义搜索索引作为Agent的知识来源,也可以从Azure AI目录中选择超过1800个模型,微软表示未来这一数字还会继续增加。
针对企业中一些常见且重复的任务,微软推出了5款新的预构建Agent,能够自动化处理各种业务流程,从日常操作到项目管理。
例如,SharePoint中的Agent允许用户创建个性化Agent,实时提问并与同事共享,便于互动;员工自助服务Agent帮助员工查询福利、工资、设备请求等HR和IT任务;Facilitator Agent在Teams和聊天中实时记录会议笔记,并提供信息摘要;Interpreter Agent为Teams会议提供最多九种语言的实时翻译;Project Manager Agent能自动化管理项目流程,从创建计划到任务分配、进度追踪等。
此外,微软还推出了Azure AI Foundry SDK。该SDK提供了低代码工具链,让开发者能够自定义、测试、部署和管理Agent。开发者可以从25种预构建模板中选择,并通过SDK将Azure AI与GitHub或Copilot Studio等应用集成。
微软业务应用程序和平台首席副总裁Charles Lamanna提出了“Agent网格”概念,这是微软AI Agent战略的核心。该网格将是一个互联系统,多个AI Agent协作完成复杂任务,而不是单独运行。
目前,微软的Copilot Studio主要支持基于聊天触发的Agent。例如,在企业场景中,销售Agent可以触发库存Agent检查库存情况,随后库存Agent通知客户服务Agent更新客户信息。这一系统由三部分组成:自主Agent、编排层和实时监控工具。
自主Agent能够检测事件并触发动作,无需人工干预;编排层协调多个专业Agent的工作,确保各个Agent之间能够无缝协作;实时监控工具提供Agent工作流程的透明度,帮助企业跟踪进展。
最近,微软的研究团队基于企业Autogen框架开发了Magnetic-One系统,建立了一个复杂的Agent等级结构。在这个系统中,管理Agent负责任务的全局调度,专业Agent专注于执行具体工作。
据VentureBeat报道,微软在Agent开发方面的技术能力已经与Anthropic和谷歌等公司相当。微软还计划将这一架构应用到例如OmniParser等工具中,以提升Agent解析用户界面元素的能力。目前,这些研究正在向生产环境过渡,但具体时间和实施细节尚未公布。
▲Magnetic-One系统结构(图源:微软)
这一架构的设计旨在解决企业在扩展AI Agent数量时遇到的问题:如何在保持系统可控的前提下,从数百个Agent扩展到数百万个Agent。通过编排层的协调能力,企业可以更高效地管理多Agent系统的发展。
此外,微软的战略也反映在其定价模式中。与其他AI供应商按token收费的方式不同,Copilot Studio基于交换的消息数量进行定价。这种模式更关注实际的业务成果,而非计算资源的使用量。
在AI Agent领域,微软凭借先发优势和广泛的用户基础暂居领先位置,数以亿计的员工正在使用其生产力套件。
其他科技公司也在积极布局这一领域。例如,Salesforce推出了Agentforce平台,已经构建了约1万个Agent,ServiceNow也推出了自家的AI Agent解决方案。然而,这些平台起步相对较晚,缺乏微软那样的企业覆盖率。
不同公司采用了多样化的战略。OpenAI专注于API服务,尚未开发完整的企业AI Agent框架;Crew等新兴公司提供实验性框架,但规模尚不足以支持大规模企业应用;LangChain的模块化框架主要用于实验性开发,而非企业部署;亚马逊通过SageMaker等平台专注于开发者群体,策略较为单一;谷歌虽然有多个AI平台,但缺乏统一的Agent框架。
与这些竞争者相比,微软的解决方案更加全面。它通过企业级安全措施、低代码开发工具、预构建模板和专业SDK,可支持不同企业团队的需求。此外,微软将其AI Agent深度集成到公司应用和分析数据库中,使Agent能够直接访问企业数据,无需单独配置检索增强生成(RAG)。
虽然微软取得了一定优势,但AI Agent技术仍处于发展初期,存在诸多技术与实施上的挑战。
首先,模型可能产生错误信息(“幻觉”问题),或导致Agent出现无意义的循环操作,带来额外的时间和成本消耗。
其次,定价与实施难度成为许多客户的顾虑。微软的Copilot定价基于消息交换数量,但在实际部署中可能带来一定成本压力,而低代码工具的灵活性能否满足多样化需求也需要时间检验。
此外,企业AI Agent领域可能会长期保持碎片化趋势。很多财富500强公司可能采取多供应商策略——既使用微软的Copilot Agent提升效率,也为更敏感的应用场景选择其他框架,以降低风险。
AI Agent技术正在从概念走向企业实践,微软在这一领域已占据领先地位。通过Copilot Studio和Azure AI,微软提供了一个整合多个模型、支持定制化部署的企业级解决方案。这一平台使得企业能够更高效地实现自动化,并通过低代码工具加速Agent的创建和部署。
然而,AI Agent仍处于发展初期,面临技术碎片化和实施复杂度等挑战。尽管微软目前占有市场主导地位,但未来竞争格局仍不确定,其他科技公司可能会在产品优化和市场适配方面迎头赶上。AI Agent能否成为企业IT架构的核心部分,仍需进一步观察。
文章来自于微信公众号 “智东西”,作者“汪 越”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI