开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到
7995点击    2026-01-17 10:48

最近几天,Anthropic 发布的智能体工具 Cowork 在 X 上爆火。


有趣的是,CAMEL AI 早前的一个开源项目 Eigent,因为和 Cowork 高度相似,作为开源平替,也跟着火了一把。 


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


这条「自嘲式」推特帖子,截止今天,一共有 8000+点赞,150 万浏览量。


简单来说,Eigent 是一个桌面端应用,通过访问本地文件和操作系统,来完成现实世界的工作任务。


这条帖子爆火后,CAMEL AI  团队复盘了他们从 2023 年发布 CAMEL 框架开始,到 Eigent 项目的三年探索经历。


对 Agent 的思考,


从 CAMEL 框架开始


2023 年 3 月,我们发布了第一个基于大语言模型的多智能体协作框架 CAMEL。最初的想法很简单:如果让多个 AI 智能体像人一样分工、交流、合作,能不能解决更复杂的问题?


上线后一周,CAMEL 获得了 4000 多个 GitHub Star,论文也被 NeurIPS 接收,Andrew Ng 还在 NeurIPS 现场用手机拍了 CAMEL 论文的 poster。


CAMEL 论文链接: https://arxiv.org/abs/2303.17760


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


CAMEL 不仅是一个框架,也是我们对智能体核心能力的早期实验场。我们为智能体装备了搜索、终端、代码编辑器等基础工具,试图让它们不仅能「想」,更能「做「,能够在真实环境中获取信息、执行代码、验证结果。


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


这个「思考-行动-反馈」的闭环设计,成了我们所有后续工作的基石。我们基于这些思考,整合出了一个早期的、能真实执行任务的智能体原型。可以说,今天 Eigent 产品的许多设计灵感和架构雏形,都深深烙印着那段时期的探索。


这里也要跟大家回顾一下 CAMEL 一直在探索 Agent 的 Scaling laws 的三个维度:


  • 智能体的数量(Number of agents):大规模智能体系统能够涌现出什么单智能体不能解决的问题,比如说社交网络等复杂系统模拟;
  • 环境(Environment):拓展智能体在复杂、多样化世界中感知、行动和学习的边界;
  • 自我进化的扩展(Evolution):探索智能体从经验中强化学习、持续学习、技能习得、记忆构建的能力;


对 Scaling Environment 的追求,在 2023 年底催生了 CRAB 项目。我们当时怀揣一个大胆的设想:能否打造一个数字世界的通用智能体?在我们看来,人类在数字空间中最通用的「工具」,就是手机和电脑。如果智能体能像人一样操作这些设备,岂不是就能跨应用、跨平台完成几乎所有任务?


为此,我们开始了让智能体学习操控真实操作系统(如 Android、Ubuntu)的探索。几乎在同一时期,学术界也涌现了如 OS World(它后来成为了该领域的标准评测基准)和 AppAgent 等优秀工作,大家在不同的路径上,朝着相似的愿景努力。


CRAB 论文链接: https://arxiv.org/abs/2407.01511

开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


2024 年 2 月底,玮婕和 Douglas 分别以产品、和设计师的身份加入团队,也是第一次团队在伦敦的线下见面,在共享办公室里探讨通用 Agent 的产品设计方案。


2024 年 4 月,我们提出了 Agent Workspace 的概念,多智能体每个 Agent 可以有不同的 Workspace,比如设计 Agent 可以有 Figma,Coding Agent 可以有 Vscode 和 Terminal,Product Manager Agent 可以有搜索引擎和文档等等。


当时,团队整体是一种兴奋的摩拳擦掌的氛围。我们认为「Workspace 就是给 agent 一台自己的电脑。不同身份的 Agent 安装使用不同的软件。「Agent 可以操作浏览器、terminal,以及用 API,GUI 的方式操控软件虚拟机完成各种复杂任务。


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


2024 年 5 月 3 日,当时国豪在伦敦还没有租房,半夜两点半在办公室点了一碗羊汤。思考白天团队讨论的产品想法,写下产品目标 Mission Lambda - 我们希望做出通用的 multi-agent 系统,让 agent 合作完成复杂任务 (操控电脑/虚拟机)。写完吹了吹凌晨 4 点 kingscross 的晚风,回来在同事桌子上睡了一宿。


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


当时产品 MVP 的开发已经如火如荼的推进中,但国豪其实一直有个挥之不去的隐忧:贸然去做一款应用且技术基础又不够扎实,产品会有种空中楼阁的感觉;而有限的资源也意味着,在开发过程中很难沉淀出 CAMEL 框架,无法将其打造成坚实的技术基础设施。


但看着兴奋的刚刚组建起来的团队,他有点不知道怎么开口。


2024 年 5 月 14 日晚,国豪和玮婕在办公室附近的中餐馆吃晚饭。两人就团队资源和目标不匹配的问题一直聊到餐馆打烊,或许连中餐馆老板都听明白了我们面临的两大难题:


  1. CAMEL 框架和 CRAB(GUI 项目)作为基础设施并不成熟,不足以支撑产品级的开发;
  2. 以我们当时只有 2 个 Engineer 的团队来说想做到这个事情难于登天;


又是一个通宵,国豪写了「Lay the Foundation」,要求团队重点回到 CAMEL 框架和社区,暂停产品开发,打造基础设施。


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


自此之后,我们的重点转向了开源社区与技术钻研。将 CAMEL 框架打磨成产品级框架,成为了团队的第一优先级,这一目标,我们几乎投入了整整一年。


Eigent 产品的萌芽:

为什么必须是桌面端?


我们当时其实在同时推进 3 条基础设施研究线。


一是Agent 操控浏览器、写代码、调用工具,这就是后来的 OWL(GitHub 18.8k 星)。二是百万量级的智能体模拟,也就是 OASIS(GitHub 2.3k 星)。三是Data Generation,包括生成verifiable data,也就是是 Loong 这个项目(截至目前数据下载量近 3 万)、function calling data、tool integrated mathematical reasoning data。这也继 CRAB 之后我们进一步做 Scaling environments 的工作,也是后面 SEA(Scaling Environments for Agents)initiative 的前置工作。


其中我们发现,OWL 距离真实落地场景已经很近。也正是因为一次偶然的爆火,加上基础设施的逐步成熟,我们决定重启 Mission Lambda,正式开始打造 Eigent 这个产品。也是因为 OWL 的爆火,那段时间我们几乎没日没夜地在解答社区伙伴的问题。微信群一度开到了 30 多个,几乎每天都能收到超过 200 条来自社区的反馈和问题。


  • OWL 论文链接: https://arxiv.org/abs/2505.23885
  • OASIS 论文链接:https://arxiv.org/abs/2411.11581
  • Loong 论文链接:https://arxiv.org/abs/2509.03059


流量稍微平稳下来之后,我们决定去摩洛哥休假,也是在那段时间里,我们重新想清楚了 Eigent 这款产品的方向和整体规划。


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


我们要开发一款围绕工作效率场景的桌面端应用,为什么要是桌面端,是因为:


  1. 上下文:因为桌面端才能直接无缝接入用户的 Context;
  2. 强大的智能体需要强大的权限,桌面端才能操控本地文件系统、软件甚至是系统级 call 和硬件; 
  3. 桌面端也可以完成所有 web 端能做的事情,不管是通过 Electron 的 Chromium 浏览器,还是以浏览器插件的方式。


Eigent 的核心在于 CAMEL 的 Workforce 系统。它的设计受分布式系统的启发,通过分工调度,来解决复杂问题。


我们将系统划分为三个核心角色:Task Agent(任务拆分)、Coordinator Agent(任务分配)、Worker Agent(任务执行和工具调用)。配合异步任务通道,系统能自动构建「任务关系图」,实现无依赖任务的并行处理与有依赖任务的有序衔接,大幅提升处理效率。


针对大模型的不确定性,系统内置了多种容错策略:重试、重规划、转派、拆解。这种动态调整机制确保了任务执行的连贯性和稳定性。


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


只有当多智能体系统与日益强大的通用能力,例如使用浏览器和终端工具结合时,企业级自动化才真正有可能落地。


Eigent 的浏览器自动化方案采用控制与编排分离的双层架构。它的设计旨在突破僵化的 API 集成局限,让 Agent 具备在真实业务环境中的原生操作能力。


我们将架构解耦为两个核心层级:Python 层(AI 编排与决策)、TypeScript 层(原生交互与执行)。TypeScript 层利用 Playwright 原生优势,专攻 DOM 操作、SoM 标记渲染及遮挡检测;配合 WebSocket 异步通讯通道,系统实现了非阻塞式的指令流转,有效规避了纯 Python 方案的高延迟与底层访问限制。


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


因为我们自己缺乏 MacOS 和 Windows 双系统全栈产品开发的经验,在产品开发过程中其实遇到了不少困难。那段时间我们和两位外部全栈工程师一起推进了将近两个月,才终于把一个能在双系统完整跑起来的产品做出来。


为了这次发布,我们甚至还在伦敦找电影团队拍了一部「电影」去介绍 Eigent 这个多智能体协作产品的概念。


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


时间来到 Eigent 正式发布的时候,当时我们其实在沙特,准备服务我们第一家商业化大客户。

开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


这里夹带一些私货,给大家看看我们团队在沙特发布产品的vlog😂


2025 年 7 月 29 日晚 Eigent 终于上线了,发布后 20 小时内,注册用户突破 2000 人,发布后一小时就有 2 位个人用户付费订阅,还有十几家企业客户主动联系,希望在他们的企业内部试用我们的产品。


但其实我们一开始的发布没有想清楚产品第一波面向的群体该是谁,加上产品的不稳定迫使我们进入沉寂期,我们需要重新思考产品的定位,到底应该服务什么样的客户,最后决定先聚焦 b 端和开发者。


2025 年 11 月为了更好做企业交付,我们所有开发成员集中到常州开发。


虽然我们没有销售团队,但本地、工作场景、开源的产品定位为我们从社区吸引来了一些企业客户的信赖。


例如一家中东拥有 1.1 万名员工的大型企业,首先在他们的 IT helping desk(IT 服务台)部门率先试点,让 Eigent 借助内部浏览器协助处理 IT 工单,从自动提取邮箱信息到填写系统表单,再到自主判断优先级并分配处理人员。


后续一家世界领先的头部开源数据公司希望用 Eigent 应用于销售流程,让 Eigent 收集散落在邮箱、即时通讯软件,本地文件的销售线索,并使用浏览器整理到 Salesforce 这样的系统中台。


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


为了打磨企业场景,我们构建了企业内部基准测试(Inner Enterprise Benchmark),例如 Salesforce 等 CRM 系统环境和任务以及 Verifier。这受到 Google Gemini 团队的关注,因此在 Gemini 3 系列研发期间,我们被邀请参与内测以及对模型能力进行评估。Google 官方也推荐 Eigent 为下一代 AI Agent 代表之一。


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


同时为了打磨产品基础能力,我们通过 GAIA、WebArena、WebVoyage、Terminal-Bench 等公开 Benchmark 打磨了 browser toolkit 和 terminal toolkit。现在 terminal toolkit 已经用到产品了,terminal rl 在研究结果上也已经有成果,就是我们前几天发布的项目 SETA,被两位前 OpenAI Cofounder 点赞(John Schulman,Andrej Karpathy),强化学习训练环境构建的经验也帮助我们拿下了几个客户,包括头部的大模型公司的环境和数据订单。


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


Terminal Toolkit 设计图


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


Terminal RL 的架构图


再到前两天因为我们的「自嘲式」推特帖子爆火了一次,截止今天,帖子一共有 8000+点赞,150 万浏览量了。


帖子爆火后我们收到了不少出乎意料的回应。一个 xAI 的内部员工邀请我们看看 xAI,Hugging Face 的 Co-founder Thomas Wolf 也在评论区留言支持。我们也」顺手」把 openwork 的域名「斥巨资」买了下来,但还是决定坚持自己的 branding,不跟风改名。


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


同时我们也开始公开招全栈,结果没多久就有 Anthropic 的人在 LinkedIn 上主动加我们好友,看来我们现在也正式进入 Anthropic 的「雷达范围」了 😂


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


上线后,也有社区的小伙伴在 X 上分享了使用体验:「在 Linux 上成功跑通了,虽然中间遇到了一些小问题,但最后顺利跑起来了。接下来准备打包成 AppImage。」 


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


也有开发者反馈,在 macOS 上搭配 LLM Studio 使用体验也不错。


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


与此同时,我们也和 MiniMax 达成了合作。他们在官方渠道发布了基于 Eigent 和 M2.1 模型的使用案例。


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


除了 M2.1,Eigent 也已经可以兼容运行如 智谱 GLM-4.7、Kimi K2、Qwen3-235b 等多个主流模型。


我们也和智谱合作,用智谱 glm-4.7 模型,让 Eigent 整理今天电脑桌面上的工作文件,并生成日报。


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


以及我们用 Kimi K2、Qwen3-235b 和 DeepSeek-V3.2,做了两个填写 Salesforce 表单的任务用例。


就在刚刚,Eigent 登顶了 GitHub trending,成为了今天的第一名!


开源版 Cowork 项目在 X 爆火,创始人:感谢 Cowork,让我们三年的探索被看到


写在最后:


我们想要打造的,是一款全栈的开源 Agent 系统,从模型到框架到产品,这也是为什么我们这么注重开源生态和强化学习的原因。


文章来自于微信公众号 “Founder Park”,作者 “Founder Park”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/