融完3000万美元之后，这家公司把"方向盘"交给了AI

融完3000万美元之后，这家公司把"方向盘"交给了AI｜专访CREAO

6252点击 2026-04-15 14:57

员工的AI，还是AI的员工？

融完3000万美元之后，这家公司把

2026年的AI，一道新的分水岭正在涌现。

大模型的能力仍在进化，但“对话”已经不再新鲜。企业客户开始追问一个更务实的问题：这东西到底能替我干多少活？

所有人的注意力，已经从“模型有多大”转向了“agent有多可靠”。OpenAI、谷歌、Anthropic纷纷推出agent编排框架，创业公司则扎进更垂直的场景——法律、财务、营销、客服。赛道从“百模大战”，变成了“百agent大战”。

在这场 agent 竞赛中，CREAO 是一个独特的存在。这家很早就起步的硅谷创业公司，要如何应对巨头的竞争？他们的护城河在哪里？每年1440美元的订阅费，用户为什么愿意买单？

带着这些问题，我们和CREAO的创始人兼CEO程凯、CTO Peter Pang做了一场长谈，他们坦诚交流了产品的真实数据、技术壁垒来源、AI Native开发的完整流程、内部关键决策的重大转向，这是CREAO首次对外披露。

快问快答

🚥 十字路口

年龄？

👦🏻 程凯

🧑‍💻 Peter

🚥 十字路口

毕业院校？

👦🏻 程凯

多伦多大学数学系本科，哥大统计系硕士

🧑‍💻 Peter

石溪大学物理博士

🚥 十字路口

MBTI 和星座？

👦🏻 程凯

ENTJ，双子座

🧑‍💻 Peter

INTP，双鱼座

🚥 十字路口

一句话介绍你现在的公司和产品？

👦🏻 程凯

CREAO，base在硅谷，做的是Agent OS——一个让用户创建、管理、运行AI Agent的平台。

🚥 十字路口

融资情况？

👦🏻 程凯

从去年初到现在，一年内完成了三轮融资，累计金额约3000万美元。

🚥 十字路口

收入和利润？

👦🏻 程凯

新产品3.0上线两周，数据比预期好不少，但具体金额暂时不方便披露。

🚥 十字路口

团队规模？

👦🏻 程凯

20人左右

🚥 十字路口

一句话介绍创业前在做什么？

👦🏻 程凯

2016年创办语忆科技并担任CEO，为500+ 全球名企提供过 AI 解决方案。

🧑‍💻 Peter

先后在苹果、Meta担任应用科学家，曾主导开发LLama 3 核心系统研发。

CREAO：让工作自动化的 Agent OS

🚥 十字路口

首先，简单介绍一下CREAO是一家怎样的公司？为什么2026年了，你们还在做“通用agent”？

👦🏻 程凯

先回答第一个问题。

CREAO 是一家base硅谷的 AI 公司，我们核心做的事情是：让 AI 在真实的工作场景中真正用起来。

CREAO的出发点很朴素。2023年大模型出来的时候，所有人都很兴奋，但你去看企业里、工作场景里，会发现，没人真把AI用起来。我们当时服务过一些大公司，像宝洁，他们愿意花两万人民币买一条prompt。两万块，买一条prompt。你就知道大家有多渴望，但又多不知道怎么下手。

所以我们从第一天就在解决一个问题：不管底层是什么模型，怎么让人和工作场景真正提效，如果能做到的话，全自动化托管。

🧑‍💻 Peter

我补充回答一下。至于为什么2026年了还在做"通用 agent"——其实我们不完全认同"通用"这个定义。

我们做的不是又一个 ChatGPT，我们做的是 Agent OS——一个让用户可以创建、管理、运行 agent 的平台。这不是通用聊天，而是工作自动化。

这个赛道的竞争远没有结束。而且恰恰相反，真正的竞争刚刚开始。

之前大家在比“谁能聊得更像人”，现在比的是“谁能可靠地完成任务”。这是完全不同的游戏。你需要构建完整的 Harness 系统，包括memory、self-healing、context管理。这些是真正的壁垒，不是套一层API就能搞定的。

现在，用户在我们平台上搭建的 agent，80%-90% 都在被重复使用，在稳定地执行工作任务，不是聊完就扔的那种。

融完3000万美元之后，这家公司把

🚥 十字路口

CREAO，为什么取这个名字？

👦🏻 程凯

这个问题好多人问。

这个名字来源其实很朴素。我们最早做的方向是合成数据，当时提出的概念是用 AI 创造 AI，所以取了"创造 Create"的词根 Crea。但域名全被占了，我们就即兴发挥取了CREAO——读起来还算顺口。

我觉得一个名字等它真成了品牌，自然就有意义了。在那之前，编再多故事也没用。

ARPU，做到了同类产品的5-6倍

🚥 十字路口

你们的3.0产品——Agent OS上线两周了，实际表现怎么样？能不能给一些具体的数字——付费订单量、客单价？

👦🏻 程凯

我们新产品3月31日正式上线，上线不到半个月，增长速度超出我们自己的预期。但具体金额我现在不方便披露。

现在，注册用户在30万到40万之间，85%到90%的用户在工作场景使用。agent复用率，也就是用户搭完还继续用的比例在80%到90%。这个跟1.0完全不一样，那时候搭完就扔。

ARPU（单个用户平均收入），大约是同类产品的5-6倍。我们是月订阅加credit消耗，定价在同品类里是最高的，但用户愿意付，很多用户选择了年度订阅。

🚥 十字路口

哪些人在为每年1440美元的订阅付费？用户画像是怎样的，可以举一两个具体例子吗？

👦🏻 程凯

核心用户画像很集中——律师、财务、注册会计师、营销人员。律师是我们目前最集中的垂直领域。

案例一，我们自己就是最深度的超级用户。CREAO内部，AI已经渗透到几乎每个职能。产品发布说明是AI从changelog自动生成的，功能介绍视频是AI做的，社交媒体日更是AI编排和自动发的，健康报告是AI从数据库自动生成的……GTM工作大概85%到90%，都是产品自己完成的。

举个例子，Peter花了两周，用CREAO的agent，重构了整个产品架构。

案例二，一位北美律师。他用CREAO搭了好几个agent，自动化合同审查、案例研究、客户通信。以前需要一个paralegal才能完成的工作量，现在一个人就能处理。agent每个月稳定跑。

这些人愿意付高价的逻辑很简单：他们算的不是“AI工具值多少钱”，算的是“这个agent帮我省了多少人力成本”。一个律师或会计师的时间成本，远高于每月120美元的订阅费。

🚥 十字路口

律师、会计师这类客户对数据安全极其敏感。你们在产品层面做了什么设计来赢得他们的信任？

🧑‍💻 Peter

最核心的一件事，我们给每一个用户请求提供独立的Sandbox环境。每一个请求。用户的代码、数据、上下文完全隔离。API密钥通过Secret Key Management系统管理，加密存储，创建后不可查看，只在Sandbox里以环境变量调用。

在基础设施层面，我们都基础设施跑在AWS上，有自动扩容，有断路器自动回滚，假如部署后出现指标恶化，系统自己会退回去。我们有一套完整的监控和告警体系。

🚥 十字路口

如果现在让你总结，做好一个Agent产品，你认为最重要的几件事是什么？

🧑‍💻 Peter

第一，Harness系统。OpenAI今年2月发了“harness engineering”的概念：工程团队的主要工作不再是写代码，而是让agent有效工作。我们在他们发表之前，其实就得出了这个结论。

第二，Memory和Context管理。用得越多，agent越了解你，这是个飞轮。

第三，Self-healing闭环。这也是我们系统的核心。每天早上自动运行健康检查：AI分析错误模式，自动生成工单。修复后系统重新检查，bug解决之后自动关单。这形成了一个 self-healing 闭环。

第四，可靠的基础设施。独立Sandbox、六阶段部署流水线、三重AI代码审查，这些听起来“无聊”的工程工作，正是用户信任的基础。

融完3000万美元之后，这家公司把

“我们围绕 AI 重新设计了一切”

🚥 十字路口

你们的对标产品是谁？用户通常会把你们和哪些产品做比较？你们自己觉得和他们的本质差异是什么？

👦🏻 程凯

首先，我们的定位是 Agent OS，我们核心对标的不是某一个具体产品，而是未来工作场景的入口级产品。

用户经常拿我们和这几类产品比较：第一类是，Zapier、Make、n8n那种workflow自动化工具，属于规则驱动型，用户自己设计流程；但是我们是AI驱动，自然语言描述就行。

第二类是，ChatGPT、Claude那种对话产品，属于助手型，完成一次对话；但我们做的是可重复运行的agent。

第三类是，Cursor、Replit那种代码Agent平台，能build但没有持久化调度。

另外，还有各种垂直AI工具，这些工具在单一领域运行或许不错，但用户的工作是多维度的，这也是我们的优势。

融完3000万美元之后，这家公司把

🧑‍💻 Peter

我们的独特性在于，我们可能是唯一同时覆盖四层能力的产品：Assist、Execute、Create repeatable agents、Run/Orchestrate/Improve。

但更重要的差异，其实不是功能列表，而是我们围绕 AI 重新设计了一切。

大多数公司是“AI-assisted”——在现有流程上加一个Copilot，效率提升10%到20%，但没有结构性改变的地方。我们是“AI-first”——重新设计流程、架构和组织，让AI成为主要的构建者，人提供方向和判断。

这个差异，是乘法级的。

融完3000万美元之后，这家公司把

🚥 十字路口

你们有去挑战一些benchmark吗？有没有哪个榜单能体现你们的优势？

🧑‍💻 Peter

坦率说，没有。传统benchmark，不太适用于agent产品。

两层原因。第一，agent关注多步骤执行，不是单次文本生成质量。第二，也是更重要的：agent在工作场景里执行的任务，很难有标准的feedback loop。写一篇文章、做一份分析报告，没有标准答案，我们很难主观评判好坏。

所以我们没把精力放在刷榜上。我们对自己的benchmark是运营数据——用户留存、付费转化、日活。这些指标的上升，比任何榜单都有说服力。

🚥 十字路口

你们反复提到“labor work”很重要。能不能举个具体的例子，如果没做好这件事，用户的使用体验会差在哪里？

🧑‍💻 Peter

就拿AI生成PPT来说。

所有AI产品都能做这件事，底层模型差距不大。差异化，就在模板上。

假设两个平台。平台A投入大量设计师和前端人力，积累了500多套高质量模板，覆盖商务汇报、教育课件、营销方案、投资路演。平台B只有20套通用模板。

用户说“做一个Q2营销复盘PPT”：平台A可以根据行业、历史偏好、使用记忆推荐最合适的模板，生成结果拿出去就能用；平台B生成的看起来像“AI通用幻灯片”，用户还得花大量时间调整。

这就是labor work的价值。AI能力是地基，但模板、prompt工程、场景适配，这些需要人力打磨的东西，决定了最后20%的体验差距。而这20%，往往决定用户是否续费。

但这不只是模板的问题。我在工程博客里写过一个观点：你需要有“产品品味”（product taste）的人。他们能看一眼AI生成的UI，就知道哪里不对劲，能在用户投诉之前发现问题。

这种判断力AI暂时替代不了。

“我们只有25人，转型摩擦非常小”

🚥 十字路口

Claude最近推出了Managed Agents。过去自建Harness的差异化优势明显被拉平了，大家某种程度上回到了同一条起跑线。这种情况下，你们的优势怎么体现？

🧑‍💻 Peter

我先承认一个事实，在AI时代，具体的产品特性本身不会成为巨大的差异化因素。今天你有的功能，别人3个月后也可能有。

所以，我们的竞争力从来不在于“我有Harness你没有”。Claude推出Managed Agents确实降低了门槛。但问题不是有没有Harness，而是整个组织的迭代效率。

给你一个数字。上周二，我们上午10点上线一个新功能，中午12点跑完A/B测试，下午3点因为数据不好把它砍掉了，下午5点上线了一个更好的版本。3个月前，这样一个周期需要花六周。过去14天，我们平均每天3-8次生产部署。

而且，Claude的Managed Agents，更像是API层的能力。而我们构建的是完整交付系统——六阶段部署流水线、三重AI代码审查、self-healing闭环、自动分诊引擎。每个工具只负责一个阶段，没有哪个工具试图做所有事。

还有就是，小公司的转型优势。大公司做AI native转型阻力巨大。我们只有25人，转型摩擦非常小。

🚥 十字路口

你们内部在用“AI Native”的方式开发产品，从想法到上线只需要几个小时。能不能走一遍这个流程，比如某个真实功能，一天之内是怎么完成的？

🧑‍💻 Peter

好，我走一遍真实开发的流程。

第一步，架构师定义任务。架构师把任务写成一个结构化的prompt，不是传统PRD文档，是直接对AI可读的指令，包含代码库上下文、目标和约束。

第二步，Agent自动分解任务、规划实现路径、写代码，顺便自己把测试用例也写了。

第三步，三重 AI 审查并行启动。PR一提交，自动触发三个并行的Claude审查——代码质量、安全审查、依赖扫描。人类审查者只看战略风险，不逐行检查正确性。一天部署8次的时候，没有哪个人类审查者能对每个PR都保持注意力。

第四步，六阶段部署流水线。它包括：验证CI→构建部署Dev→测试Dev→部署Prod→测试Prod→发布。没有任何阶段可以跳过，没有手动覆盖。流水线是确定性的，所以agent可以预测结果并推理失败的原因。

第五步，Feature Flag 灰度发布。每个功能都在feature gate后面上线——先对团队开放，然后逐步放量，最后全量或砍掉。Kill switch可以在不重新部署的情况下即时关闭一个功能。

第六步，结果导向的A/B测试。数据说这个方向不对就立即砍掉，团队马上进入下一个迭代。

目前的结果是，过去14天，我们平均每天完成 3-8 次生产部署。按旧模式，两周时间可能连一次上线都完不成。

融完3000万美元之后，这家公司把

🚥 十字路口

回顾这两年的创业历程，技术层面有哪些关键节点突破？

👦🏻 程凯

分为三个阶段。

2026年之前，都处于1.0阶段，做vibe coding。

当时，我们对标Lovable、Replit——用coding方式帮用户搭APP。但是，遇到一个问题，因为搭出来的东西没有AI能力，用户使用率低。

转折点发生在2026年2月，Opus 4.6发布。当时，Peter判断说，“Opus 4.5做不到4.6能做的事”。这个跃升是决定性的，coding agent从junior跳到senior水平。

当时，我们做了一个大胆的决定——把所有代码统一到一个monorepo。我们的逻辑是：让AI能看到全貌。分散的代码库对agent来说是不可见的。统一之后，agent才能理解整个系统。

那也是2.0阶段，2026年2月-3月，我们花了一周设计新架构，又花了一周，让agent自己把整个代码库重写了。是的，我们用自己的 agent ，重建了这个平台。

当前，3月31日产品上线之后，属于3.0阶段——Agent OS。

CREAO 关键时间节点：

融完3000万美元之后，这家公司把

CTO亲自动手，写代码到凌晨3点

🚥 十字路口

两年时间，发展到今天的状态，和你们的预期一致吗？有没有觉得错过了什么关键时点？

👦🏻 程凯

从产品收入看，超出预期。但团队更关注的，是公司自身对产品的使用深度。以marketing为例，大概85%到90%已经自动化，还有10%需要人力，我们希望持续提升。

关于是否错过时间点？我们认为没有。2025年11月，我们就决定从vibe coding转型。当时vibe coding还有增长，但我们判断，天花板有限。

如果说最大的经验教训，就是传统流程太慢了。

Peter说过一句话，让我印象很深——“花几个月思考一件事，然后两小时就能做完，这没有意义。”

所以我们做了AI native转型，把决策链路从“月”级，压缩到“天”级，明显提高了效率。

我们 CTO 也就是Peter本人，也从管理模式转成了构建模式。Peter亲自动手，他现在每天从早上9点写代码到凌晨3点，从管理者变成了系统的架构者。

“数据说了算，不是谁说了算”

🚥 十字路口

公司内部的决策机制是什么样的？如果你们俩意见不一致，怎么定？

🧑‍💻 Peter

核心原则——以结果验证想法，而不是以权威决定方向。

新想法出来，我们不先开会争论，而是让AI先分析，哪些部分可以直接验证，哪些需要人判断。能测的就测，AB testing、数据分析、log monitoring收集反馈。数据说了算，不是谁说了算。

还有一个变化。转型之后，我和联合创始人、工程师之间的关系反而更好了。以前，内部大部分互动是对齐会议——讨论取舍、争论优先级、技术决策分歧。这些在传统模式下是必要的，但也很消耗。

现在我们还是会聊天，但聊的是别的东西——非工作话题、轻松对话。因为不再争论那些可以被系统轻松完成的工作了。

PM的角色也在变。传统PM花几周研究、设计、写spec。但当agent两小时就能实现一个功能的时候，几周的规划周期就成了瓶颈。PM需要进化成能跟上迭代速度的产品型架构师，或者退出构建周期。

🚥 十字路口

在AI First的环境下，员工会不会感觉被AI“管理”了？人的创造性和主动性怎么平衡？

👦🏻 程凯

这是一个非常真实的问题。我不会假装每个人都很开心。

Peter在内部很坦率地讨论过。我们把工程师分成两类。

一类是架构师（Architect），一两个人。他们设计SOP教AI怎么工作，构建测试基础设施、集成系统、分诊系统。决定架构和系统边界，定义什么是“好”的标准。这个角色需要深度的批判性思维——你要批评AI，而不是跟随它。

另一类是执行者（Operator），其他人。AI给人分配任务——分诊系统发现bug，创建工单，呈现诊断结果，分配给合适的人。人来调查、验证、批准修复。AI提交PR，人审查风险。

我们有一个意外的发现：初级工程师适应得比高级工程师快。初级工程师感觉被赋能了，AI放大了他们的影响力，他们没有十年的习惯需要忘掉。而高级工程师最难适应，他们两个月的工作量，AI一小时就能完成。曾经花了多年积累稀缺技能，突然壁垒消失了，这很难接受。

但我们的原则是，我们不会因为一个工程师引入了生产bug就开除他。我们改进审查流程，加强测试，增加防护。AI也一样，如果AI犯了错，我们构建更好的验证、更清晰的约束、更强的可观测性。

🚥 十字路口

你多次提到“效率”是这场竞赛中最关键的变量。你们具体做了哪些配置来提高效率？

👦🏻 程凯

在这个时代，组织的效率是最大的竞争保障。谁能让公司效率比同行高10到20倍，谁就能取得优势。

我们做的最重要的一件事，是让AI渗透到每一个职能，而不只是工程。比如，产品发布说明、功能介绍视频、社交媒体日更、健康报告全部由AI自动生成。

如果工程以agent速度运作，而市场营销还是人类的速度，那市场营销就是瓶颈。任何有人参与的环节，都将成为瓶颈。

另外，Founders的角色也转型了。我之前60%的时间用于做管理，现在变成了90%的时间，花在构建系统和工具上。传统模式中，创始人赋能团队、培训等。但新系统下，创始人必须自己先动手。

🚥 十字路口

还有哪些可提升的？

🧑‍💻 Peter

未来，一人公司将变得普遍。

in the future，一个架构师加agent，能做100人的工作，很多公司不需要第二个员工。

融资3000万美元之后

🚥 十字路口

聊聊当前的融资情况？

👦🏻 程凯

我们已经完成三轮融资，累计已超过 3000万美元。最新一轮的领投方为 Prosperity7 Ventures和经纬创投，其它老股东包括云启资本、MONOLITH、高瓴创投、红杉中国、华业天成资本也持续跟投。

近期会有新的融资计划，但具体还不方便透露。

🚥 十字路口

你多次提到in the future 的远期愿景，你们怎么把它拆解成可执行的具体步骤？

🧑‍💻 Peter

我们以3个月、6个月、一年为时点，做了任务目标拆解。

当前阶段，是人告诉AI构建什么工具来解决什么任务，用户有完全的掌控权。我们预期，3-5个月后，AI能够自己知道该构建什么工具了，用户只需要说“处理这周的法律文件”，AI就能自动判断需要哪些agent、如何编排。人在其中，只在关键节点确认即可。

一年后，AI可以自动完成大部分工作，人只需要查看最终的结果。

下面是CREAO制定的时间表：

融完3000万美元之后，这家公司把

访谈结束时，程凯再次强调，CREAO的核心核心衡量标准永远是：用户是否真的在用产品完成工作，产品替代人力的比例，是否在持续提升。

对于CREAO来说，更紧迫的问题可能是：

在巨头入场、资本降温、企业客户仍持观望态度的2026年，一个20人左右的团队，如何把一个“有趣的项目”变成一门“可持续的生意”？

文章来自于"十字路口Crossing"，作者 "壹小姐"。

关键词: AI新闻 , CREAO , CREAO AI , CREAO专访

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0