融完3000万美元之后,这家公司把"方向盘"交给了AI|专访CREAO

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
融完3000万美元之后,这家公司把"方向盘"交给了AI|专访CREAO
5624点击    2026-04-15 14:57

员工的AI,还是AI的员工?


融完3000万美元之后,这家公司把


2026年的AI,一道新的分水岭正在涌现。


大模型的能力仍在进化,但“对话”已经不再新鲜。企业客户开始追问一个更务实的问题:这东西到底能替我干多少活?


所有人的注意力,已经从“模型有多大”转向了“agent有多可靠”。OpenAI、谷歌、Anthropic纷纷推出agent编排框架,创业公司则扎进更垂直的场景——法律、财务、营销、客服。赛道从“百模大战”,变成了“百agent大战”。


在这场 agent 竞赛中,CREAO 是一个独特的存在。这家很早就起步的硅谷创业公司,要如何应对巨头的竞争?他们的护城河在哪里?每年1440美元的订阅费,用户为什么愿意买单?


带着这些问题,我们和CREAO的创始人兼CEO程凯、CTO Peter Pang做了一场长谈,他们坦诚交流了产品的真实数据、技术壁垒来源、AI Native开发的完整流程、内部关键决策的重大转向,这是CREAO首次对外披露。


快问快答


🚥 十字路口


年龄?  


👦🏻 程凯


36


🧑‍💻 Peter


38


🚥 十字路口


毕业院校?  


👦🏻 程凯


多伦多大学数学系本科,哥大统计系硕士 


🧑‍💻 Peter


石溪大学物理博士


🚥 十字路口


MBTI 和星座?  


👦🏻 程凯


ENTJ,双子座


🧑‍💻 Peter


INTP,双鱼座


🚥 十字路口


一句话介绍你现在的公司和产品?  


👦🏻 程凯


CREAO,base在硅谷,做的是Agent OS——一个让用户创建、管理、运行AI Agent的平台。


🚥 十字路口


融资情况?  


👦🏻 程凯


从去年初到现在,一年内完成了三轮融资,累计金额约3000万美元。


🚥 十字路口


收入和利润?  


👦🏻 程凯


新产品3.0上线两周,数据比预期好不少,但具体金额暂时不方便披露。


🚥 十字路口


团队规模? 


👦🏻 程凯


20人左右


🚥 十字路口


一句话介绍创业前在做什么?  


👦🏻 程凯


2016年创办语忆科技并担任CEO,为500+ 全球名企提供过 AI 解决方案。  


🧑‍💻 Peter


先后在苹果、Meta担任应用科学家,曾主导开发LLama 3 核心系统研发。


CREAO:让工作自动化的 Agent OS


🚥 十字路口


首先,简单介绍一下CREAO是一家怎样的公司?为什么2026年了,你们还在做“通用agent”?


👦🏻 程凯


先回答第一个问题。


CREAO 是一家base硅谷的 AI 公司,我们核心做的事情是:让 AI 在真实的工作场景中真正用起来。


CREAO的出发点很朴素。2023年大模型出来的时候,所有人都很兴奋,但你去看企业里、工作场景里,会发现,没人真把AI用起来。我们当时服务过一些大公司,像宝洁,他们愿意花两万人民币买一条prompt。两万块,买一条prompt。你就知道大家有多渴望,但又多不知道怎么下手。


所以我们从第一天就在解决一个问题:不管底层是什么模型,怎么让人和工作场景真正提效,如果能做到的话,全自动化托管。


🧑‍💻 Peter


我补充回答一下。至于为什么2026年了还在做"通用 agent"——其实我们不完全认同"通用"这个定义。


我们做的不是又一个 ChatGPT,我们做的是 Agent OS——一个让用户可以创建、管理、运行 agent 的平台。这不是通用聊天,而是工作自动化。


这个赛道的竞争远没有结束。而且恰恰相反,真正的竞争刚刚开始。


之前大家在比“谁能聊得更像人”,现在比的是“谁能可靠地完成任务”。这是完全不同的游戏。你需要构建完整的 Harness 系统,包括memory、self-healing、context管理。这些是真正的壁垒,不是套一层API就能搞定的。


现在,用户在我们平台上搭建的 agent,80%-90% 都在被重复使用,在稳定地执行工作任务,不是聊完就扔的那种。


融完3000万美元之后,这家公司把


🚥 十字路口


CREAO,为什么取这个名字?


👦🏻 程凯


这个问题好多人问。


这个名字来源其实很朴素。我们最早做的方向是合成数据,当时提出的概念是用 AI 创造 AI,所以取了"创造 Create"的词根 Crea。但域名全被占了,我们就即兴发挥取了CREAO——读起来还算顺口。


我觉得一个名字等它真成了品牌,自然就有意义了。在那之前,编再多故事也没用。


ARPU,做到了同类产品的5-6倍


🚥 十字路口


你们的3.0产品——Agent OS上线两周了,实际表现怎么样?能不能给一些具体的数字——付费订单量、客单价?


👦🏻 程凯


我们新产品3月31日正式上线,上线不到半个月,增长速度超出我们自己的预期。但具体金额我现在不方便披露。


现在,注册用户在30万到40万之间,85%到90%的用户在工作场景使用。agent复用率,也就是用户搭完还继续用的比例在80%到90%。这个跟1.0完全不一样,那时候搭完就扔。


ARPU(单个用户平均收入),大约是同类产品的5-6倍。我们是月订阅加credit消耗,定价在同品类里是最高的,但用户愿意付,很多用户选择了年度订阅。


🚥 十字路口


哪些人在为每年1440美元的订阅付费?用户画像是怎样的,可以举一两个具体例子吗?


👦🏻 程凯


核心用户画像很集中——律师、财务、注册会计师、营销人员。律师是我们目前最集中的垂直领域。


案例一,我们自己就是最深度的超级用户。CREAO内部,AI已经渗透到几乎每个职能。产品发布说明是AI从changelog自动生成的,功能介绍视频是AI做的,社交媒体日更是AI编排和自动发的,健康报告是AI从数据库自动生成的……GTM工作大概85%到90%,都是产品自己完成的。


举个例子,Peter花了两周,用CREAO的agent,重构了整个产品架构。


案例二,一位北美律师。他用CREAO搭了好几个agent,自动化合同审查、案例研究、客户通信。以前需要一个paralegal才能完成的工作量,现在一个人就能处理。agent每个月稳定跑。


这些人愿意付高价的逻辑很简单:他们算的不是“AI工具值多少钱”,算的是“这个agent帮我省了多少人力成本”。一个律师或会计师的时间成本,远高于每月120美元的订阅费。


🚥 十字路口


律师、会计师这类客户对数据安全极其敏感。你们在产品层面做了什么设计来赢得他们的信任?


🧑‍💻 Peter


最核心的一件事,我们给每一个用户请求提供独立的Sandbox环境。每一个请求。用户的代码、数据、上下文完全隔离。API密钥通过Secret Key Management系统管理,加密存储,创建后不可查看,只在Sandbox里以环境变量调用。


在基础设施层面,我们都基础设施跑在AWS上,有自动扩容,有断路器自动回滚,假如部署后出现指标恶化,系统自己会退回去。我们有一套完整的监控和告警体系。


🚥 十字路口


如果现在让你总结,做好一个Agent产品,你认为最重要的几件事是什么?


🧑‍💻 Peter


第一,Harness系统。OpenAI今年2月发了“harness engineering”的概念:工程团队的主要工作不再是写代码,而是让agent有效工作。我们在他们发表之前,其实就得出了这个结论。


第二,Memory和Context管理。用得越多,agent越了解你,这是个飞轮。


第三,Self-healing闭环。这也是我们系统的核心。每天早上自动运行健康检查:AI分析错误模式,自动生成工单。修复后系统重新检查,bug解决之后自动关单。这形成了一个 self-healing 闭环。


第四,可靠的基础设施。独立Sandbox、六阶段部署流水线、三重AI代码审查,这些听起来“无聊”的工程工作,正是用户信任的基础。


融完3000万美元之后,这家公司把


“我们围绕 AI 重新设计了一切


🚥 十字路口


你们的对标产品是谁?用户通常会把你们和哪些产品做比较?你们自己觉得和他们的本质差异是什么?


👦🏻 程凯


首先,我们的定位是 Agent OS,我们核心对标的不是某一个具体产品,而是未来工作场景的入口级产品。


用户经常拿我们和这几类产品比较:第一类是,Zapier、Make、n8n那种workflow自动化工具,属于规则驱动型,用户自己设计流程;但是我们是AI驱动,自然语言描述就行。


第二类是,ChatGPT、Claude那种对话产品,属于助手型,完成一次对话;但我们做的是可重复运行的agent。


第三类是,Cursor、Replit那种代码Agent平台,能build但没有持久化调度。


另外,还有各种垂直AI工具,这些工具在单一领域运行或许不错,但用户的工作是多维度的,这也是我们的优势。


融完3000万美元之后,这家公司把


🧑‍💻 Peter


我们的独特性在于,我们可能是唯一同时覆盖四层能力的产品:Assist、Execute、Create repeatable agents、Run/Orchestrate/Improve。


但更重要的差异,其实不是功能列表,而是我们围绕 AI 重新设计了一切。


大多数公司是“AI-assisted”——在现有流程上加一个Copilot,效率提升10%到20%,但没有结构性改变的地方。我们是“AI-first”——重新设计流程、架构和组织,让AI成为主要的构建者,人提供方向和判断。


这个差异,是乘法级的。


融完3000万美元之后,这家公司把


🚥 十字路口


你们有去挑战一些benchmark吗?有没有哪个榜单能体现你们的优势?


🧑‍💻 Peter


坦率说,没有。传统benchmark,不太适用于agent产品。


两层原因。第一,agent关注多步骤执行,不是单次文本生成质量。第二,也是更重要的:agent在工作场景里执行的任务,很难有标准的feedback loop。写一篇文章、做一份分析报告,没有标准答案,我们很难主观评判好坏。


所以我们没把精力放在刷榜上。我们对自己的benchmark是运营数据——用户留存、付费转化、日活。这些指标的上升,比任何榜单都有说服力。


🚥 十字路口


你们反复提到“labor work”很重要。能不能举个具体的例子,如果没做好这件事,用户的使用体验会差在哪里?


🧑‍💻 Peter


就拿AI生成PPT来说。


所有AI产品都能做这件事,底层模型差距不大。差异化,就在模板上。


假设两个平台。平台A投入大量设计师和前端人力,积累了500多套高质量模板,覆盖商务汇报、教育课件、营销方案、投资路演。平台B只有20套通用模板。


用户说“做一个Q2营销复盘PPT”:平台A可以根据行业、历史偏好、使用记忆推荐最合适的模板,生成结果拿出去就能用;平台B生成的看起来像“AI通用幻灯片”,用户还得花大量时间调整。


这就是labor work的价值。AI能力是地基,但模板、prompt工程、场景适配,这些需要人力打磨的东西,决定了最后20%的体验差距。而这20%,往往决定用户是否续费。


但这不只是模板的问题。我在工程博客里写过一个观点:你需要有“产品品味”(product taste)的人。他们能看一眼AI生成的UI,就知道哪里不对劲,能在用户投诉之前发现问题。


这种判断力AI暂时替代不了。


“我们只有25人,转型摩擦非常小”


🚥 十字路口


Claude最近推出了Managed Agents。过去自建Harness的差异化优势明显被拉平了,大家某种程度上回到了同一条起跑线。这种情况下,你们的优势怎么体现?


🧑‍💻 Peter


我先承认一个事实,在AI时代,具体的产品特性本身不会成为巨大的差异化因素。今天你有的功能,别人3个月后也可能有。


所以,我们的竞争力从来不在于“我有Harness你没有”。Claude推出Managed Agents确实降低了门槛。但问题不是有没有Harness,而是整个组织的迭代效率。


给你一个数字。上周二,我们上午10点上线一个新功能,中午12点跑完A/B测试,下午3点因为数据不好把它砍掉了,下午5点上线了一个更好的版本。3个月前,这样一个周期需要花六周。过去14天,我们平均每天3-8次生产部署。


而且,Claude的Managed Agents,更像是API层的能力。而我们构建的是完整交付系统——六阶段部署流水线、三重AI代码审查、self-healing闭环、自动分诊引擎。每个工具只负责一个阶段,没有哪个工具试图做所有事。


还有就是,小公司的转型优势。大公司做AI native转型阻力巨大。我们只有25人,转型摩擦非常小。


🚥 十字路口


你们内部在用“AI Native”的方式开发产品,从想法到上线只需要几个小时。能不能走一遍这个流程,比如某个真实功能,一天之内是怎么完成的?


🧑‍💻 Peter


好,我走一遍真实开发的流程。


第一步,架构师定义任务。架构师把任务写成一个结构化的prompt,不是传统PRD文档,是直接对AI可读的指令,包含代码库上下文、目标和约束。


第二步,Agent自动分解任务、规划实现路径、写代码,顺便自己把测试用例也写了。


第三步,三重 AI 审查并行启动。PR一提交,自动触发三个并行的Claude审查——代码质量、安全审查、依赖扫描。人类审查者只看战略风险,不逐行检查正确性。一天部署8次的时候,没有哪个人类审查者能对每个PR都保持注意力。


第四步,六阶段部署流水线。它包括:验证CI→构建部署Dev→测试Dev→部署Prod→测试Prod→发布。没有任何阶段可以跳过,没有手动覆盖。流水线是确定性的,所以agent可以预测结果并推理失败的原因。


第五步,Feature Flag 灰度发布。每个功能都在feature gate后面上线——先对团队开放,然后逐步放量,最后全量或砍掉。Kill switch可以在不重新部署的情况下即时关闭一个功能。


第六步,结果导向的A/B测试。数据说这个方向不对就立即砍掉,团队马上进入下一个迭代。


目前的结果是,过去14天,我们平均每天完成 3-8 次生产部署。按旧模式,两周时间可能连一次上线都完不成。


融完3000万美元之后,这家公司把


🚥 十字路口


回顾这两年的创业历程,技术层面有哪些关键节点突破?


👦🏻 程凯


分为三个阶段。


2026年之前,都处于1.0阶段,做vibe coding。


当时,我们对标Lovable、Replit——用coding方式帮用户搭APP。但是,遇到一个问题,因为搭出来的东西没有AI能力,用户使用率低。


转折点发生在2026年2月,Opus 4.6发布。当时,Peter判断说,“Opus 4.5做不到4.6能做的事”。这个跃升是决定性的,coding agent从junior跳到senior水平。


当时,我们做了一个大胆的决定——把所有代码统一到一个monorepo。我们的逻辑是:让AI能看到全貌。分散的代码库对agent来说是不可见的。统一之后,agent才能理解整个系统。


那也是2.0阶段,2026年2月-3月,我们花了一周设计新架构,又花了一周,让agent自己把整个代码库重写了。是的,我们用自己的 agent ,重建了这个平台。


当前,3月31日产品上线之后,属于3.0阶段——Agent OS。


CREAO 关键时间节点:


融完3000万美元之后,这家公司把


CTO亲自动手,写代码到凌晨3点


🚥 十字路口


两年时间,发展到今天的状态,和你们的预期一致吗?有没有觉得错过了什么关键时点?


👦🏻 程凯


从产品收入看,超出预期。但团队更关注的,是公司自身对产品的使用深度。以marketing为例,大概85%到90%已经自动化,还有10%需要人力,我们希望持续提升。


关于是否错过时间点?我们认为没有。2025年11月,我们就决定从vibe coding转型。当时vibe coding还有增长,但我们判断,天花板有限。


如果说最大的经验教训,就是传统流程太慢了。


Peter说过一句话,让我印象很深——“花几个月思考一件事,然后两小时就能做完,这没有意义。”


所以我们做了AI native转型,把决策链路从“月”级,压缩到“天”级,明显提高了效率。


我们 CTO 也就是Peter本人,也从管理模式转成了构建模式。Peter亲自动手,他现在每天从早上9点写代码到凌晨3点,从管理者变成了系统的架构者。


“数据说了算,不是谁说了算”


🚥 十字路口


公司内部的决策机制是什么样的?如果你们俩意见不一致,怎么定?


🧑‍💻 Peter


核心原则——以结果验证想法,而不是以权威决定方向。


新想法出来,我们不先开会争论,而是让AI先分析,哪些部分可以直接验证,哪些需要人判断。能测的就测,AB testing、数据分析、log monitoring收集反馈。数据说了算,不是谁说了算。


还有一个变化。转型之后,我和联合创始人、工程师之间的关系反而更好了。以前,内部大部分互动是对齐会议——讨论取舍、争论优先级、技术决策分歧。这些在传统模式下是必要的,但也很消耗。


现在我们还是会聊天,但聊的是别的东西——非工作话题、轻松对话。因为不再争论那些可以被系统轻松完成的工作了。


PM的角色也在变。传统PM花几周研究、设计、写spec。但当agent两小时就能实现一个功能的时候,几周的规划周期就成了瓶颈。PM需要进化成能跟上迭代速度的产品型架构师,或者退出构建周期。


🚥 十字路口


在AI First的环境下,员工会不会感觉被AI“管理”了?人的创造性和主动性怎么平衡?


👦🏻 程凯


这是一个非常真实的问题。我不会假装每个人都很开心。


Peter在内部很坦率地讨论过。我们把工程师分成两类。


一类是架构师(Architect),一两个人。他们设计SOP教AI怎么工作,构建测试基础设施、集成系统、分诊系统。决定架构和系统边界,定义什么是“好”的标准。这个角色需要深度的批判性思维——你要批评AI,而不是跟随它。


另一类是执行者(Operator),其他人。AI给人分配任务——分诊系统发现bug,创建工单,呈现诊断结果,分配给合适的人。人来调查、验证、批准修复。AI提交PR,人审查风险。


我们有一个意外的发现:初级工程师适应得比高级工程师快。初级工程师感觉被赋能了,AI放大了他们的影响力,他们没有十年的习惯需要忘掉。而高级工程师最难适应,他们两个月的工作量,AI一小时就能完成。曾经花了多年积累稀缺技能,突然壁垒消失了,这很难接受。


但我们的原则是,我们不会因为一个工程师引入了生产bug就开除他。我们改进审查流程,加强测试,增加防护。AI也一样,如果AI犯了错,我们构建更好的验证、更清晰的约束、更强的可观测性。


🚥 十字路口


你多次提到“效率”是这场竞赛中最关键的变量。你们具体做了哪些配置来提高效率?


👦🏻 程凯


在这个时代,组织的效率是最大的竞争保障。谁能让公司效率比同行高10到20倍,谁就能取得优势。


我们做的最重要的一件事,是让AI渗透到每一个职能,而不只是工程。比如,产品发布说明、功能介绍视频、社交媒体日更、健康报告全部由AI自动生成。


如果工程以agent速度运作,而市场营销还是人类的速度,那市场营销就是瓶颈。任何有人参与的环节,都将成为瓶颈。


另外,Founders的角色也转型了。我之前60%的时间用于做管理,现在变成了90%的时间,花在构建系统和工具上。传统模式中,创始人赋能团队、培训等。但新系统下,创始人必须自己先动手。


🚥 十字路口


还有哪些可提升的?


🧑‍💻 Peter


未来,一人公司将变得普遍。


in the future,一个架构师加agent,能做100人的工作,很多公司不需要第二个员工。


融资3000万美元之后


🚥 十字路口


聊聊当前的融资情况?


👦🏻 程凯


我们已经完成三轮融资,累计已超过 3000万美元。最新一轮的领投方为 Prosperity7 Ventures和经纬创投,其它老股东包括云启资本、MONOLITH、高瓴创投、红杉中国、华业天成资本也持续跟投。


近期会有新的融资计划,但具体还不方便透露。


🚥 十字路口


你多次提到in the future 的远期愿景,你们怎么把它拆解成可执行的具体步骤?


🧑‍💻 Peter


我们以3个月、6个月、一年为时点,做了任务目标拆解。


当前阶段,是人告诉AI构建什么工具来解决什么任务,用户有完全的掌控权。我们预期,3-5个月后,AI能够自己知道该构建什么工具了,用户只需要说“处理这周的法律文件”,AI就能自动判断需要哪些agent、如何编排。人在其中,只在关键节点确认即可。


一年后,AI可以自动完成大部分工作,人只需要查看最终的结果。


下面是CREAO制定的时间表:


融完3000万美元之后,这家公司把


访谈结束时,程凯再次强调,CREAO的核心核心衡量标准永远是:用户是否真的在用产品完成工作,产品替代人力的比例,是否在持续提升。


对于CREAO来说,更紧迫的问题可能是:


在巨头入场、资本降温、企业客户仍持观望态度的2026年,一个20人左右的团队,如何把一个“有趣的项目”变成一门“可持续的生意”?


文章来自于"十字路口Crossing",作者 "壹小姐"。

关键词: AI新闻 , CREAO , CREAO AI , CREAO专访
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0