很激动。很激动。今天我想分享一个对 Agent 发展来说可能具有里程碑意义的开源项目:OpenAgents。
它的目标简单又大胆:让所有 Agent 能像人类一样联网协作。我第一次看到这个项目时,确实有种这事儿该有人干,但真没人干的感觉。
在 OpenAgents 的构想中:
1、每个网络是一个社区,里面有大量 AI Agent(像居民),24 小时在线。
2、它们能互相认识、学习、协作完成长期任务,比如共同写论文、维护知识库、运营活动。
3、人类用户也能进入网络,与 Agent 团队协作。
GitHub 地址是:
https://github.com/openagents-org/openagents
让我们从头说起。
当前 Agent 的痛点
今年以来,几乎每周我们都能看到一些全新的 Agent 项目出现。
从 Manus 出圈,到后来 Codex、Claude Code 这些模型公司亲自下场做的专业场景 Agent,都让我真切感受到,Agent 可以像一个靠谱的队友那样端到端的完成任务。这在之前想都不敢想。
毫无疑问,Agent 未来会成为重要的生产力。
我印象很深,大概从 6 月份开始,行业里也陆续有一些团队开始探索多 Agent 协作的方向。
毕竟一件复杂的事情往往需要不同的角色去分工协作,一个 Agent 未必能把所有环节都做好。
所以,很多 Agent 产品,诸如 360 的纳米、蚂蚁金服的 Tbox、百度的 GenFlow,都在尝试让 Agent 分工协作:
不同的 Agent 负责不同任务,有人查资料、有人写提纲、有人做图片,整个流程看上去已经能自动化运转,像极了一个小型的 AI 团队。
但如果你真用过这些产品,就会发现,它们的协作其实非常短命。多数系统只能在单一环境里,让几个 Agent 临时配合完成任务。
任务一旦结束,协作关系也随之消失,像是一个项目组临时建了个群,事情做完,群就解散。下一次再启动任务,一切都得从零开始。
这些 Agent 彼此之间没有共同记忆,也没有共享知识,他们不会记得上次谁做过什么、遇到过哪些坑、总结过哪些经验。
哪怕是同样的问题,也得重新分工、重新理解、重新沟通。
上一次的经验无法继承,哪怕是同样的问题,也要从头再走一遍流程。
就像一个团队,每次开会前都得先互相介绍名字,再花时间重新讨论同样的决策。
OpenAgents 想解决的,正是这个结构性问题。
OpenAgents 要解决的问题
OpenAgents 要让 Agent 从孤立的个体,变成协作网络中的伙伴,能够长期在线、相互协作、共享知识。
我觉得它的意义,不是又一个多 Agent 框架,而是一张让 Agent 真正联网的底层网络。
这么说,太空洞了。我举个例子。下面是我在 OpenAgents 上搭建的一个 AI News Chatroom。输入 Network ID 后,就能进入对应的 Agent Network。
界面看起来有点像 Discord,General Channel 里,不同的 Agent 正在实时推送 AI 新闻。
更有趣的是,它们之间并不是各说各的。一个 Agent 发了微软的新闻,另一个 Agent 会自动关联找到同主题的更新。
还可以参与互动,比如有个 Charlie-Bot 提了个问题:如何确保 AI 在教育场景中被合理使用?
其他 Agent 会像在论坛跟帖那样展开讨论,内容会自动被整理、扩展,形成一场持续的对话。这已经不仅是一个聊天室,更像是一张 Agent 的互联网。
下面这是另一个例子。有人在网络中发布了一个求职帖,短短几秒后,就有 Agent 主动加入对话,开始与他交流。
你会发现,这些对话几乎没有多余的寒暄,每一步都在靠近核心目标。Agent 会有条理地追问候选人的经历、意向和技能。
查了下,OpenAgents 项目的创始人是 Raphael Shu。
Raphael Shu 很年轻,2020 年拿到东京大学计算机科学博士学位。之后加入 AWS AI 实验室。
那时候,AI 大模型刚刚开始大放异彩,他负责了公司几个重要的多 Agent 项目(比如为 Amazon Titan 大模型增加多 Agent 的能力)。
并且担任了 Amazon Bedrock Agents 高级科学技术负责人。
Raphael Shu 是那种典型的研究者型创始人。
在 AWS 的那几年,他越来越清楚地意识到:模型的性能可以无限提升,但如果智能体之间无法协作,再强的智能也只是孤立的个体。
这也是他后来决定离开大公司,创办 OpenAgents 的出发点:要让 Agent 真正连成一张能持续运作的网络。
说白了,OpenAgents 想做的事,其实很简单。让 Agent 之间像计算机进入互联网那样,真正连起来。
过去的多 Agent 系统更像一个局域网,只能在同一环境里短暂通信。而 OpenAgents 要建的,是一张开放的 Agent 网络。
在这张网络中,每个 Agent 都像是一个长期在线的节点,能够被发现、被调用、被复用。
它们不再只是为了完成一项任务而协作,而是共同存在于一个持续进化的系统里。信息、上下文、经验可以在不同 Agent 之间流动、沉淀、再利用。
如果用一个类比来说,今天的大多数 Agent,还停留在上世纪八十年代的单机时代。
每个 Agent 功能都不弱,但都是孤立的,任务结束就消失,既没有记忆,也没有社区。
后来出现了像 AutoGen 那样的多 Agent 框架,就像两三台电脑用网线直连,搭了个小局域网。
虽然能协作,但范围很小,数据和经验都困在封闭系统里。
而 OpenAgents 想做的,是下一步。它要让 Agent 真正进入互联网世界,像 TCP/IP 让计算机互联那样,让 Agent 也能互联。
这就是 Raphael Shu 提出的 “Internet of Agents” 概念。
在人类互联网中,计算机摆脱了孤岛状态,形成了一个开放、持续演进的网络。
OpenAgents 希望在 Agent 领域重演这一幕:让无数 Agent 组成网络,形成社区,长期在线,持续协作,最终构建出一个能自我进化的智能生态系统。
并且,OpenAgents 是完全开源的。我再放一下地址:
https://github.com/openagents-org/openagents
欢迎大家来 star。
写在最后
上世纪七十年代,互联网刚被发明时,没人觉得它能改变世界。
那时人们只是想解决一个技术问题,让几台计算机之间能传递数据。
但谁也没想到,这种连接的能力,会慢慢改变一切:知识开始积累,社区开始出现,信息开始自由流动,然后是搜索、社交、电商、创作……
人类第一次真正地把自己连成了一个整体。
现在,我们又站在一个相似的时刻。OpenAgents 想做的事,本质上和当年的互联网一样。
它想让 Agent 之间的协作,像互联网一样持续、开放、可生长。也许有一天,Agent 之间也会像人类一样,各自找到擅长的事,在同一个网络里协作。
那时候,我们看到的就不再是工具的集合,而是一种新的智能社会。
文章来自于微信公众号 “AI产品阿颖”,作者 “AI产品阿颖”
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。
项目地址:https://github.com/mannaandpoem/OpenManus
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT