近日,AI编程智能体初创公司 Factory 完成1.5亿美元C轮融资,投后估值达到15亿美元,正式跻身独角兽行列。本轮由Khosla Ventures领投,Sequoia Capital、Blackstone、Insight Partners、Evantic Capital、20VC、NEA和Mantis VC参与跟投。Khosla Ventures董事总经理Keith Rabois同时加入Factory董事会。
本轮募集资金将主要用于加速研发投入、产品迭代以及全球市场拓展。
在AI 编程赛道,从融资规模来看,Anysphere 无疑是最“吸金”的一家,若近期20亿美元融资顺利落地,将成为AI编程领域有史以来规模最大的单轮融资。其估值在不到两年间从4亿美元飙升至500亿美元,翻了超过100倍。截至2026年2月,其产品Cursor年化收入已达20亿美元,预计年底将超过60亿美元。
紧随其后的是Cognition,以102亿美元的估值稳居赛道估值头部。这家由三位华人青年创立的公司,至今已累计融资超过4亿美元,投资方包括Founders Fund、Khosla Ventures等顶级机构。凭借Devin这个“AI软件工程师”的概念,Cognition在资本市场掀起了一波又一波热潮。
Factory 相对“低调务实”。累计融资约2.2亿美元、估值15亿美元,目前在三者中规模最小。但这并不意味着Factory缺乏竞争力——公司从A轮融资到C轮融资仅用了约22个月,估值从1.2亿美元增长至15亿美元,增幅达11.5倍;其核心产品Droids已被数十万开发者每日使用,客户涵盖NVIDIA、Adobe、安永和摩根士丹利等顶级企业,并已连续六个月保持月营收环比翻倍的增长势头。
在这些大规模融资背后,谁的产品才是AI编程赛道企业级的最优解?
三种路径,三种定位
Anysphere:从IDE到智能体调度中心

Anysphere 的产品 Cursor 最初是VS Code的一个fork,以AI增强的代码编辑器身份切入市场。但其创始人Michael Truell提出了一个更具前瞻性的判断:软件开发正在进入“第三个时代”——从Tab补全,到同步智能体,再到能够独立完成长周期任务的云端智能体。
Cursor 3的发布彻底验证了这一判断。新版本将智能体管理控制台作为主界面,IDE被降级为次要位置,用户的主要工作从“写代码”变成了“调度智能体、审查输出、决定发布任务”。最具标志性的功能是Cloud Handoff——用户可以将正在运行的智能体会话从本地无缝迁移到云端,让智能体在开发者离线时继续工作。
如今,Cursor内部合并的Pull Request中已有35%由云端自主运行的智能体创建。用户的习惯也已发生根本性反转:2025年3月,Tab用户数量约是智能体用户的2.5倍;如今,智能体用户数量已是Tab用户的2倍。Cursor的本质,正在从一个代码编辑器演变为一座“生产软件的工厂”。
Cognition:完全自主的AI工程师

Cognition走的是另一条路。其核心产品Devin被定义为“AI软件工程师”,能够端到端完成需求理解、任务拆解、代码编写、调试运行与迭代优化的全过程。高盛在2024年7月率先引入Devin,称其为“从不睡觉的新入职AI程序员”。
与Cursor强调“开发者始终在循环中”不同,Devin的设计理念是完全委派。用户只需输入任务描述,Devin就能将其拆解为步骤、编写代码、运行测试、读取错误日志、自动修复问题,最后提交一个Pull Request供人类审查。开发者退出关键路径,仅在预设的检查点重新介入。
不过,Devin也面临挑战。Cognition在2025年卷入了一场震动行业的收购大战——OpenAI原计划收购Windsurf但因知识产权顾虑终止,谷歌以24亿美元获得其技术非独占授权并吸纳核心团队,Cognition随后宣布接手Windsurf剩余资产。这次整合让Cognition的ARR实现翻番,但也引发了对估值是否过高的质疑——有分析指出,Cognition虽然ARR增长迅速,但核心收入基础仍显薄弱。
Factory:企业级自主智能体

Factory的定位最为专注——就是服务企业工程团队。其核心产品Droids覆盖从IDE到CI/CD的完整开发生命周期,企业可以将重构、事故响应和代码迁移等完整任务委派给Droids,无需改变工具、模型或工作流。
Factory近期上线的Missions功能将自主化推向了新的高度。Missions被搭载在Droids上,可自主管理多天跨度的复杂任务。用户只需下达指令,智能体就能自动拆解任务、按时间和逻辑顺序执行,并在每一步进行验证和错误修复。最极端的情况下,Missions可连续工作长达40天,极大地拉高了AI编程智能体的自主化上限。
与Anysphere 和Cognition 相比,Factory最大的差异化在于其模型无关的设计理念。创始人Matan Grinberg多次强调,Factory的核心竞争优势在于能够灵活切换不同的基础模型——无论是Anthropic的Claude还是中国的DeepSeek,Droids都能适配。这一策略让Factory能够快速拥抱模型技术的最新进展,而不被单一模型所绑定。
谁提供了最优解?
从估值角度看,Anysphere 的500亿美元和Cognition的102亿美元,都远高于Factory的15亿美元。但这并不意味着Factory被“甩开”——三家公司瞄准的市场阶段和客户群体本就不同:Anysphere 的 Curser 面向的是从个人开发者到企业客户的广泛市场,用户数已超过200万,付费用户超100万;Cognition 凭借 Devin 的概念成功吸引了金融、咨询等传统行业的大客户;而Factory则用 Droids 深耕企业工程团队这一细分领域,以定制化服务取胜。
01)定位哲学:三种截然不同的“人机关系”
Anysphere、Cognition、Factory 产品的差异,首先不是功能上的,而是哲学上的——它们各自回答了同一个问题:AI应该以什么身份与开发者协作?
Cursor 的答案是:AI是“副驾驶”。它默认开发者始终在驾驶位上,AI负责感知上下文、提供即时建议、执行局部操作。这是一种对称协作——人机之间高频互动、彼此依赖。
Devin的答案是:AI是“虚拟工程师”。它试图模拟一名人类同事的行为模式:理解需求、制定计划、独立执行、汇报结果。这是一种拟人化委托——你像管理一名远程员工一样管理它。
Droids 的答案是:AI是“自动化流水线”。它把软件开发视为可拆解、可并行、可验证的工程流程,AI像工厂里的机器人,接收任务、自主拆解、输出结果。这是一种异步委托——你只管下单,它负责交付。
这三种哲学,决定了它们从界面到架构的每一项设计选择。
02)技术路线的第一性原理:控制权在哪里?
从技术路线看,三者的核心分歧点在于控制权的转移程度。
Cursor 的技术路线是 “实时协同过滤” 。它的模型被训练成“响应性”极强——每秒250个token的生成速度、基于光标位置的上下文感知、即时采纳/拒绝机制。控制权牢牢握在开发者手中,AI永远在等待你的下一次按键。
Devin 的技术路线是 “环境闭环自主” 。它运行在一个完整的云端沙盒中(包含Shell、浏览器、编辑器),能自己安装依赖、运行测试、甚至部署预览。它的模型经过了大量多轮强化学习,学会了“犯错-观察-纠正”的循环。控制权几乎完全交给AI,你需要像信任一名初级工程师一样信任它。
Droids 的技术路线是 “任务分解与编排” 。它不追求实时,而是构建了一个多智能体调度器,能将一个自然语言任务(如“重构整个支付模块”)自动拆解为几十个子任务,分配给不同的“Droid”(专职智能体),并设置验证关卡。控制权被移交给调度算法,工程师只关心最终结果。
因此,Cursor 控制权在人,Devin 控制权在AI自身,Droids 控制权在流程。
03)代码库的“理解方式”:图、向量还是知识图谱?
这三款工具对代码库的“理解”方式完全不同,这直接影响了它们处理大型项目的能力。
Cursor 使用语义搜索。它把整个代码库转化为向量嵌入,当工程师提问时,它通过相似度检索最相关的代码片段。这种方式速度快、对自然语言友好,但缺乏对代码间隐式依赖(如“这个函数被哪个宏控制?”)的建模能力。
Devin 的核心是 DeepWiki + Deep Search。DeepWiki自动为代码库生成架构图、API文档、数据流图,相当于构建了一个知识图谱。Deep Search则是在这个图谱上进行语义检索。Devin不仅能“找到”代码,还能“理解”它为什么这么写。
Droids 使用 HyperCode + ByteRank。这是一个图结构的代码表示,不仅包含调用图、继承图,还能通过ByteRank算法挖掘隐式关系(比如“这两个文件虽然不直接引用,但经常同时被修改”)。这让Droids 能像资深架构师一样感知代码的“设计痕迹”。
如果工程师维护的是一个百万行级别的遗留系统,Droids 的图检索和Devin 的知识图谱会比Cursor的向量搜索更有优势。
04)任务执行范式:同步、“托管”与异步
从工程师发出指令到得到结果,三者经历了完全不同的时间尺度和交互模式。
Cursor 是同步执行。工程师写一行注释,它立即补全函数;工程师选中一段代码,它立刻弹出重构建议。延迟以毫秒计,交互是双向的、高频的。
Devin 可以称为异步托管,这种托管介于Curser 和Droids 之间。工程师给Devin一个Issue,它会立刻开始工作,并在过程中不断更新进度(比如“正在安装依赖…”“测试失败,正在修复…”)。工程师可以随时查看它的计划并修正方向。它不会像Cursor那样实时响应,但也不像Droids 那样完全黑盒。
Droids 是异步执行。工程师把任务通过Jira工单或Slack命令丢给Droids,它的调度器可能花几分钟甚至几小时拆解任务,然后Droids开始工作,期间工程师可以做别的事,完成后会得到它的通知。最长任务可以持续40天(比如一个大型数据库迁移)。这是一种“提交-等待-验收”的模式。
可以说Cursor适配“控制狂”,Devin适配“技术经理”,Droids 则适配“甩手掌柜”。
05)模型策略:自研、后训练与路由
三者在“用什么模型”这个问题上,选择了不同的经济学路径。
Cursor 早期依赖OpenAI等第三方模型,但后来自研了Composer模型(MoE架构+强化学习),目的是控制延迟和成本。同时它也保留了多模型切换的能力,但自研模型是它的护城河。
Devin 的核心技术是在基础模型之上的后训练。它使用自定义的多轮强化学习,让模型学会“在沙盒里试错”。但Devin的模型本身不对外开放,工程师也无法替换成别的模型。这是一种封闭但深度优化的策略。
Droids 旗帜鲜明地走 “模型无关” 路线。它的调度器会根据任务类型动态路由:写代码用Claude、搜索文档用DeepSeek、做代码审查用GPT-4。它把自己定位为模型编排层,而不是模型提供方。这对企业客户很有吸引力——不会被任何一家模型厂商锁定。
Cursor想自己造轮子,Devin想造一辆整车,Droids 则想当轮子的调度员。
06)安全与可控性:企业级设计的分水岭
对于企业客户,这三款工具的可控性差异极大。
Cursor 作为本地IDE,代码默认不上传(云端补全功能除外),但它缺少细粒度的审计和策略控制。适合个人或小团队,大企业用起来可能会心慌。
Devin 的沙盒在Cognition的云端,企业代码必须上传。虽然有隔离措施,但金融、政务、军工等行业很难通过合规审查。Cognition目前也主要服务中小型技术团队。
Droids 做了大量的企业级安全设计:Droid Shield自动扫描密钥和敏感信息,沙箱环境隔离执行,可编程Hooks让企业插入自己的合规检查(比如“不允许任何Droid访问生产环境配置”)。它还支持私有化部署。可以说,Droids 就是为企业合规部门量身定做的。
07)适用心智模型:工程师在扮演什么角色?
最后,这三款工具对应了三种不同的“使用者心智模型”。
使用 Cursor 时,工程师扮演的是 “吉他手”——AI是效果器,工程师需要实时弹奏、即兴发挥。工程师的价值在于创意和手感。
使用 Devin 时,工程师扮演的是 “技术导师”——给实习生派活、审查他的PR、在他卡住时指点方向。工程师的价值在于判断力和经验。
使用 Droids 时,工程师扮演的是 “工厂厂长”——制定生产计划、验收成品、优化流水线。工程师的价值在于流程设计。
没有高低之分,只有合不合适。
不是替代,是分工
如果问“哪个工具最强”,这个问题本身并不需要被回答。Cursor、Devin、Droids 并不是竞争关系,而是分工关系——它们分别服务于开发过程中的不同环节、不同粒度的任务。
工程师可以在一个项目里同时用它们:日常编码用Cursor,重复性的Issue交给Devin,大型重构丢给Droids。未来的软件开发,不再是“人 vs 工具”,而是“人 + 多智能体协作网络”。
AI编程赛道的竞争格局正在迅速演进。随着Anthropic的Claude Code、GitHub Copilot等产品的强势入局,以及OpenAI、谷歌等基础模型厂商将智能体能力内嵌至平台,这三家初创公司未来将面临来自多方的压力。
但无论如何,一个清晰的趋势已经浮现:AI编程正在从“代码补全”走向“智能体协同”。无论是Anysphere 的智能体调度中心、Cognition的完全自主AI工程师,还是Factory的企业级自主智能体,它们都在用各自的方式回答同一个问题——当AI能写代码之后,开发者应该做什么?这个问题的答案,将决定未来软件工程的形态,也将决定这三家公司最终的胜负归属。
文章来自于微信公众号 "六观阿尔法",作者 "六观阿尔法"
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI