「软件不应再等待被使用,而是在需要它的那一刻才存在。」
这是 Agencize AI 创始人张浩然,对于 AI-Native 时代工作流/软件该如何设计的一种回答。
多年 SaaS/无代码创业的经历,2021 年、2025 年两次登上奇绩创坛的 Demo Day,做了十几年生产力工具的张浩然,对于 AI 工作流有很多自己的想法。
「我们想解决的不是 『做 AI 工作流』,是『根本不需要有工作流』。所有要求用户『预先构建工作流』的 Agent 都是错的。」
在他看来,SaaS 不会因为 Agent 而消亡,但 SaaS 会成为 AI 时代新的基础设施,Agencize AI 会为用户即时生成各类个性化的软件,连接和利用好传统 SaaS 软件。

在 Agencize AI 产品发布之前,我们和张浩然聊了聊他对于生产力工具和工作流的看法,以及 Agencize AI 的真正竞争力。
产品官网:https://agencize.ai/
Founder Park:怎么介绍你的产品?解决了什么核心痛点?
张浩然:我们希望用户不需要预先构建任何工作流,只需要描述意图,就能替用户完成 95% 以上的自动化工作。实现的方式,是为用户生成一个个性化的软件,来替代 Ta 过去手动的重复性操作。
本质上,我们面向的是所有知识工作者,为他们提供一种以意图驱动、全新的生产力工具和交互方式。就像 Excel 开启了数字化办公时代一样,我们认为 AI 时代也需要一个对标 Excel 的划时代产品,改变大家在 AI 时代的工作方式。所以,我们的目标是面向知识工作者的通用场景,不是某个具体行业。
Founder Park:举一个典型的用户场景,哪一类人用这个工具解决什么问题?
张浩然:几周前,我们在海外做了一些小范围的推广,收集了 100 多个 waitlist 申请。其中,访谈了一位心理医生,他的 case 非常典型。
他的日常工作流是:每天要整理 WhatsApp 里的医患对话,生成报告,然后更新到 Notion 的对应病人文档中;之后还要和病人约下次沟通的时间,如果病人回复了,就要把时间同步到 Google 日历,而且在日历里还要附上病人的 Notion 文档链接。
以前做这些事特别麻烦,每天只能手动处理,效率很低。他也试过 n8n、Zapier,都没解决问题。直到看到我们的产品演示,他觉得这就是他想要的形态,不用复杂操作,只要说明每天要做的事、同步到 Notion 和 Google 日历,我们的产品就能自主推理、调用他的工具,串联成一个完整的工作流。只要再加上一个「每天 9 点运行」的触发器,整个流程就能完全自动化了。
这就是我们期望的典型场景:让每个知识工作者都能组合自己常用的多个工具,达成最终目标。我们的核心用户有两个特点:一是完成一件事需要用多个工具;二是做事的环节相对固定,但每个环节的具体内容又高度变化、有不确定性。这类场景,我们能解决得很好,但是在过去的 SaaS 时代、软件时代、自动化时代都解决不了的问题。
Founder Park:你们的产品更像是在现有的 SaaS 工具之间搭桥梁,并不是替代它们?
张浩然:是的,我们不会消灭任何软件。我们认为,SaaS 本身就是一种基础设施,重构了社会的数字化。
虽然 SaaS 在中国有点失败,但它的价值不可否认。个人的生活数字化被各种 App 瓜分了,但我们社会的运行,真正还是在被「软件吞噬世界」这件事完全数字化掉。我们的目标是在 SaaS 的基础上,利用新技术带来新价值,做更进一步的价值交付,而不是去替代每一个应用。
Founder Park:也就是说,传统的 SaaS 软件成为了新基建,你们用一种新的方式来连接它们。用户不需要再来一个标准化的软件,而是可以随时、随意地在任意工具之间生成一个流程来连接彼此。
张浩然:是的。过去用 n8n、Zapier,你必须要先设定好「当这个应用触发后,那个应用要做什么」。如果能把流程想清楚,搭建本身不难;真正的问题是,非技术人员根本没法想明白、串起这些逻辑——他们脑子里的需求,和这些工具的使用方式是对不上的。
现在确实有很多 AI 工作流工具,但我们想解决的不是「做 AI 工作流」,而是「根本不需要有工作流」。所有要求用户「预先构建工作流」的 Agent 都是错的。Agent 是个交互环境,核心得围绕你的目标来:要是你已经把要做的事梳理清楚了,Agent 的价值反而低了,它最大的价值应该体现在帮你梳理需求的过程中。
所以我们想再往前一步:不需要用户梳理完再来找我,而是在跟我对话的过程中,我就帮用户把需求越理越清。当用户最终确认「对,这就是我要的」,任务就可以自动运行了。这个关键在任务生成前的互动。就像有个 AI 工作伙伴,它会先用你的工具试做一遍,然后问你:「是这样操作吗?」你说:「不对,那个地方需要调整。」它调整完再问:「这次对了吗?」你确认后说:「对了,以后每天 9 点都这么运行。」任务就固定下来了。
现在的工作流工具,都是拖拽模块、连接模块……根本不是真正的 Agent。我们希望让「Agent」这个概念消失,让普通用户不需要理解它是什么,只需要在这完成工作。系统会记住并学习他的做事方式,之后让 AI 替他做。这才是我们真正想做的事。
Founder Park:你希望用户在使用你们的产品时,在哪个环节体验到「aha moment」?
张浩然:当他给出一个模糊的指令,我们立刻给出了结果,并且这个完成方式超出了他的预期。比如把一个模糊的需求丢过来,结果这事居然真办成了。这是我们观察到最强烈的惊喜时刻,用户会觉得「你的 AI 真聪明」。
很多海外用户体验后会说:「这才是真正的 AI,不是 ChatGPT 那种只会聊天的。」这种「魔法时刻」,远比让用户自己去研究如何配置工具更有冲击力。
Founder Park:从测试来看,用户达到「aha moment」需要多久?
张浩然:快的可能一分钟,慢的需要两三轮额外对话。如果指令明确,用户用我们提供的模板一点,马上就能跑通。如果用户觉得结果不符合预期,会跟 AI 说「不该从那个工具找,要从这个工具找」,经过一两轮调整,结果也会很准。
而且「准」是相对的,关键是有没有达到用户预期。哪怕有些细节错了,用户也会很「aha」,因为他意识到「原来 AI 能力这么强,只是我刚才指令没说清」。
Founder Park:在交付形式上,用户是需要把完整的流程细节都告诉 AI,还是只需要给一个任务目标?
张浩然:只需要给目标。比如我自己会说:「每天 9 点,看看我官网昨天有多少人申请了白名单,然后在 Slack 里发个全员公告,提醒运营同事关注。」就这样,结束了。我不需要告诉它白名单在哪个工具里,也没说 Slack 发在哪个频道,但是我的 AI 就会知道。因为我们在这里做了很多工作,当这些信息 AI 全都知道的时候,构建工作流就很简单了。但真正人的工作在脑子里产生的那一刻是很模糊的:「我要把那个东西发到那」。我们能接收并处理这种模糊的用户指令。
AI 会替我找到最合适的软件,在软件中完成操作,然后把将多个软件串联起来。最后 AI 会告诉我:「我已经在你的 A 应用里做了什么操作,并且在 Slack 里发了公告,还需要我做什么吗?」然后任务就结束了。
Founder Park:最后生成的自动化流程,每次的执行过程会完全一样吗?还是会很自主?
张浩然:这个过程相对标准化,但不是绝对的。还是刚才的场景:当你确认一套流程没问题,设置了「每天 9 点运行」后,我们会为你生成一个专属的、个性化的软件。
软件界面会清晰地展示整个流程,比如「9 点触发」,然后是「在 A 应用搜索 XX 内容」,接着「确认得到 XX 结论后,去 B 应用发运营公告」。这个工作流不是你手动搭建的,而是 AI 在理解了你的意图和操作后,自动生成的。
简单来说,如果你明确说「每天从我楼下那家瑞幸点美式咖啡」,它就会严格执行。如果你只说「每天点一杯美式给我同事」,它就会在中间拥有一定的自主决策空间。

通过 chat 完成任务,用户只需要关心结果,无需预先构建工作流
Founder Park:最终生成的个性化软件里,那些传统 n8n 或 workflow 里固定的节点,还存在吗?
张浩然:其实还在,但颗粒度很粗,而且它是后置的,不是前置的。这些模块可能粗到像「选个咖啡馆、订杯美式」这样的程度。
「后置」这点特别重要。现在没有人意识到「预先构建工作流」是错的,大家都觉得得先把工作流编排好才能用。工作流的核心问题是「角色错配」,能把工作流想清楚、搭明白的,只有工程师或结构化思维极强的人。生产力工具要面向普通大众,就得让 AI 来替他们完成「思考结构化工作流」这一步。
所以,「工作流」这个概念本身,在用户侧就不该存在。
Founder Park:「后置」具体是什么意思?
张浩然:举个例子:你招了新员工,怎么安排工作?你不会说「每天 9 点到岗,先放好衣服,再打开飞书、点开表格,看到文档里有 XX 内容就粘到那个系统里。」这种指令是反人性的。
你会说的是:「到岗后,首要任务是处理这件事。根据我的经验,建议你先从飞书里获取信息,最后把结论同步到某个地方。」你看,后者只给了目标和方向,没说具体步骤。前者就是工作流,后者就是我说的模式。你只是给了他一个目的、或者意图,怎么干,你几乎没说。
聪明的员工会自己在工具里摸索,找到关键信息完成任务;不聪明的员工会回头问:「要完成这件事得先要 XX 信息,我从哪找?」这才是人与人之间自然的协作方式。
我们做的 AI 工具就像后者:如果任务模糊,它会主动问你;如果觉得能尝试,它会自己去操作,做好了告诉你,不确定的会带着尝试的结果来找你确认。
这就是我们和「预先构建工作流」工具的区别:我们的工具像人一样灵活交互,预先构建工作流是反人类的。
Founder Park:预先构建的工作流把人的能力限制在了一个很死的框架里,他没法发挥自己的主动性。
张浩然:说得很对。Agentic 的本质就像你对一条小狗说「出去,找到骨头后回来」,它去哪找,怎么找,完全由它自己决定,你撒手就不用管了。如果没有 agentic,就是你必须得告诉它「往前一公里右转,再走五百米左转……」
我们是真正把 agentic 原生到产品里去思考这个问题的。目前,我还没看到第二家公司是这样思考的。
以及,n8n 原来干这个事需要很多个模块,它可能只是把这些模块变模糊了,只需要一个模块就搞定了。但我觉得仍然不对,这还不是 AI-native 的。AI 时代不能这么想问题。我们思考的角度不是说谁好谁坏,而是真正从 AI-native 的视角下去思考,一个 agentic、AI-native 的产品,它应该像一个人。
Founder Park:所以,现在做这类软件的出发点是,我们可以把 AI 当成一个真正的同事来交付任务了?
张浩然:是的,除非某些环节真的重要,必须明确一、二、三布分别怎么做,那 AI 也会严格遵循你的指令。它就像一个「真人」同事。
并且,我们在 agentic 的基础上自研了一套推理引擎,才可以当做人来看待。我们对「能动性」的理解是:接受一个目标后,持续对齐并完成目标的能力。基于这个理解,我们做了一套持续自适应对齐用户目标的推理架构,再结合像 Claude 这样的模型,才能做到今天这样。这背后其实是有哲学的思考。
Founder Park:今天的 AI 在「主动性」上能做到什么程度?
张浩然:我们认为,现在的「能动」和「主动」是两回事。「能动」是遵循指令完成目标,而「主动」是 AI 观察到某些特征后,自主发起行为。
主动,是我们下一步要重点做的。当 AI 充分理解你的工作环境后,它应该能自主判断什么事需要被关注。比如,它会主动跟你说:「我觉得现在做这件事很合适,原因是 XXX,要不要我启动?」甚至可能直接做完,拿着结果告诉你:「我主动分析了这些数据,建议你未来的内容方向做一些调整。」而这一切,你并没有提前给它指令。
这就是我们接下来的目标:第一步先让 AI 在你的工作空间里「站稳脚」,能感知你的所有需求;在此基础上,下一步就是「主动」。
Founder Park:现在你们实现的「能动性」,大概能达到什么状态?
张浩然:现在的状态是,你给 AI 一个模糊的任务,它能自己寻找工具、不断试错,直到把这个事干完,把结果交给你。整个链路可以调用二三十个工具,持续地对齐目标。目前我们已经做得比较稳定了,可以持续二三十步完成任务。
Founder Park:在多步执行中,怎么保证每一步完成的准确度?
张浩然:我们的推理框架会自行来解决这个问题,不用人操心。而且这个框架能判断事情的轻重:比如,修改电商商品价格这类高风险操作,它会自动弹出确认窗口:「我即将把价格调整为 XX,是否确认?」你点击确认后才会执行。简单说,它清楚什么时候该让你决策,什么时候可以自主操作。
Founder Park:对 AI 调用「工具」的能力,你们是怎么理解的?
张浩然:现在大家都觉得要给 AI 描述工具是做什么的,AI 才知道怎么用。我觉得不对。比如 Klaviyo 是一个邮件营销工具,但它到底是电商邮件工具,还是 B2B 外贸邮件工具?定义得太窄,另一类用户用起来就不准;如果同时有三个邮件工具,不定义又不知道该选哪个。
我们的解决方案是:根本不去看每个应用是做什么的,我们让 AI 理解「应用有什么能力」。我们有一套机制,把每个应用的能力点「打散」。比如,你有电商邮件营销的需求,AI 会发现 Klaviyo 在用户标签和 CDP 相关的能力点上,比 Mailchimp 更匹配电商场景,于是反推出应该使用 Klaviyo。这种细节工作我们做了很多,我们把模糊的语义理解问题,转化成了一个更精确的能力匹配问题。
Founder Park:这个「打散」和理解的过程,是怎么做的?
张浩然:我们自创了一套推理引擎,是一个双 Agent 循环架构。有一个 Agent 非常能够理解我们定义的这套能力,另一个 Agent 非常理解用户的目标,两个结合起来能很好地工作。
在上下文管理上,我们设置了一个中间层专门用来挑选工具。我们说的「能力」维度,比工具本身要更细。比如,Klaviyo 不仅有邮件查询功能,它还有一个「能带着用户标签进行查询」的能力,这就跟 Mailchimp 产生了区别。我们的拆解细到了这个程度。
当用户发出一个指令,Agent 就会在这个中间层里,找到能解决问题的能力组合,形成一个推理策略。它可能最终组合了五个能力点,然后发现这五个能力分属于两个不同工具的三个接口。这时,它会把这个包含具体接口的策略带回来,注入到上下文中,去干预下一步的推理。这样,下一步的推理就能非常明确地命中那几个工具。
Founder Park:相当于拓展了模型本身的能力,不再纠结怎么选择工具。
张浩然:是的。而且你想想,当一个用户集成了 40 个应用时怎么办?只有我们这种从业务倒推的方式才能解决。我们提前构建的这套能力,就相当于是数据标注了,我们未来做强化训练的时候,这个数据标注的价值直接就用上了。
Founder Park:你当时是怎么考虑去做这样一款产品的?
张浩然:我过往的所有经历都是围绕流程效率与生产力的。包括之前在飞书做 workflow,两次创业分别做营销 MarTech 领域的 SaaS 和帮其他 SaaS 做用户引导工具,都和流程自动化相关。
我很清楚,企业经营的本质就是不断组合工作流:把工作流拆分成不同角色,对应设置岗位,岗位再去执行相应的 SOP。过去工厂靠流水线组合 SOP,现在知识型企业就是靠无数软件拼接起来的。
在过去的知识型流水线工厂里,无数软件成为设施,人反而成了无脑执行 SOP 的「机器」,这是大量中低端员工的现状。AI 的出现,尤其是 Claude 3.5 推出后,带来了 agentic 这类模型能力的扩展。这种高能动性的核心是能持续对齐人类目标,基于目标使用人类工具,真正融入到真实生活场景中。
如果 agentic 能力一直在变强,软件行业将迎来从「软件 1.0」到「SaaS 时代的软件 2.0」,再到「软件 3.0」的巨大变革。「软件 3.0」的最大意义,在于能感知你所处空间的所有知识,还能在你所行动的空间里完成一样的行动。
这时候,软件不再是预先构建好的,而是根据你的意图实时显化、即时生成的「意图驱动型计算工具」。这会彻底打破传统的 SOP 执行模式,实现「专家平权」,让资深员工的 know-how 下沉,让月薪 5000 元的员工也能完成高端工作。
这种变革将颠覆现有软件市场,反推企业模式改变:企业不再是预先制定好工作流程,用软件把人「拴」在岗位上执行;而是人类可以专注发挥创造力,理解工作本质后,通过和 AI 工具对话传递意图,由 AI 完成工作中大量具有不确定性的「灰度」任务。人类的「灰度」工作被压缩到最小,能更高效地做出高质量决策,真正释放创造力
这是我们看到的未来,也是我们想投身去做的事。
Founder Park:你觉得产品现在找到明确的 PMF 了吗?
张浩然:我认为已经不需要再验证了。n8n、Zapier 的存在就已经证明了这个需求的强烈性。关键是,我们能不能做出比它们体验好 20 到 50 倍的构建方式。
现在大家都困在惯性里,没人敢想「让流程消失来实现自动化」。AI 时代之前,IFTTT 那样的流程引擎是最好的模式,所有人都被这种确定性思维固化了。我做过很多流程引擎工具,我知道这种模式有问题,所以敢第一个跳出惯性。
PMF 本身就在那,看得是谁能做出颠覆性的产品,改变用户解决痛点的方式,你只要会自然语言就可以了。
Founder Park:你们产品的核心壁垒是什么?
张浩然:短期壁垒是认知。我们搭建了一套让 AI 像人一样工作的认知框架,敢于跳出传统工作流的惯性,这本身就是差异。加上我们的迭代速度快,拥有先发优势。
长期壁垒是个性化软件。当 AI 通过对话帮你完成任务时,会学习你的工作方式,之后直接生成一个专属软件。比如,你需要看 Shopify 订单并去 ERP 发货,AI 能给你生成一个界面:左边是订单,右边是发货状态,甚至还会提示「这 4 个订单建议优先处理」。点一下就能操作,这多棒啊。如果没有界面,AI 只能用大段文字描述,根本满足不了真实工作的信息密度需求。
AI 与你互动的越多,就越懂你的业务经验,生成的软件也就越多。这些软件的交互数据,你为什么生成它,它动用了你哪些 know-how,你如何与它互动,得到了什么结果。最终,会形成一个独一无二的封闭数据集。未来,用这个数据集来训练我们自己的「行动型模型」,就像 Cursor 的模式一样,这就是我们的长期壁垒。
Founder Park:这个数据集能够形成数据飞轮吗?
张浩然:是的,就像 Cursor 监控你写代码的方式,用你的编程习惯和纠错记录训练小模型,这个小模型形成了数据飞轮,越用越懂你,还能实时更新模型权重,这就是我们要构建的长期壁垒。
而且,因为我们是个性化软件,个性化软件的后端本质上就是一个 Agent,它使用了你所有的工具,学到了你的 know-how 和工作流程,同时有 coding 能力,固化了一部分代码在沙盒里运行。
马卡龙、灵光都没有后端,这个世界上,没有任何一个 AI 生成的软件有后端,但我们有。
但我们会让「Agent」这个概念消失,你不用特意构建它,跟 AI 伙伴一起工作,它就会变成你的「业务分身」。本质是 Agent,但我们不会强调,因为它只是过渡产物。没人会说「先构建 Excel 再工作」,Excel 的概念早被淡化了。等哪天没人提 Agent 了,AI 才算真正走进大众。

完成任务后,可以将整个对话流程转换成自动化常规流程
Founder Park:如果 n8n 或者大厂也按这个思路来做,你们怎么防御?
张浩然:防御要靠下一步的强化学习,训练自己的模型。现在我们有一个小身位差,可以利用先发优势积累大量用户、跑通数据。我们必须在这个窗口期里,搭建用户交互到模型自训练的管道,让用户行为能动态地、持续自主地更新模型权重,形成数据飞轮。
Founder Park:担心大模型本身的能力迭代,吃掉你们的业务吗?
张浩然:有点小担心,还是要考虑这件事的风险,不能盲目乐观。
比如 Claude 和 Gemini 都在往类似方向发力:Claude 的进化,大概率会瞄准整个计算机生态,想颠覆冯・诺依曼架构,做 GPU 驱动的新一代上下文计算,所以它不会具体在应用层。但我也会紧跟变化。Gemini 有谷歌全家桶,可能会颠覆很多通用场景,但很难渗透到各行各业。
我们真正的价值,还是在积累企业的 know-how,并把这些经验转化成实际结果。本质上,Gemini 是「低抽象、高通用」,而我们在它之上再抽象一层,是「高抽象、中等通用」。因为我们要深入到组织的复杂场景里,这是大模型难以替代的。
Founder Park:你希望用户如何定位这款产品?
张浩然:我们想定位的是一个全新的工作台,就像飞机的驾驶舱。过去的驾驶舱有成千上万个按钮,你需要知道什么时候按哪一个。但现在,这个驾驶舱只有一个话筒,你对它说话,它就能自动完成操作。
如果说跟马卡龙、灵光的区别,本质上我们的产品形态是类似的,只不过是在工作的复杂场景里。既然 SOP 能被解决,为什么最终的产出只能是一句话,而不是一个软件呢?现在所有 Agent 的输出都只是一句「我做完了」,但为什么不能输出一个软件?自然语言的密度低且是线性的,而 GUI 有天然优势,软件的视觉化呈现能让你一眼看懂功能。
在真实的复杂工作场景中,很多交互是靠界面驱动的,不是语言。所以我们觉得,AI 工作伙伴完全可以通过一个界面与你交互,这不就是个性化软件吗?
Founder Park:在生产力场景下,GUI 或软件界面还是必要的。未来它的交互还会有其他形态吗?
张浩然:会有。未来会和硬件结合,不同硬件在不同场景下有不同优势,比如能语音交互的戒指,处理低密度信息推送就很高效。未来我们会考虑,当产品渗透到工作场景各环节时,让不同工作形态匹配不同交互方式:比如电商场景需要打电话问用户,这时界面就不重要了,语音交互才是核心。
不排除我们会推出硬件的可能,想象一下,把动态界面推送到 Apple Watch 上,抬手说话、看一眼小界面就能处理工作,想象空间很大。
Founder Park:现阶段你们专注于解决工作流问题,暂时不考虑个人生活场景,是觉得价值不大吗?
张浩然:我们永远不会考虑。我们公司的使命就是释放人类生产力,让组织能自主运行。像个人娱乐、服装管理这类需求,不在我们的解决范围内。
Founder Park:你们的目标用户是中小商家,还是更偏向个人的知识工作者?
张浩然:在我们看来,中小企业(SMB)和个人知识工作者本质上是一群人。比如我们自己公司目前就两个人,是典型的中小企业,工作模式和一个独立的个人没什么区别。
Founder Park:「知识工作者」这个画像有更详细的分类吗?怎么定义?
张浩然:基本上,只要是坐在电脑前,通过操作软件就能完成工作、交付结果、产生经济效益的这群人,都算是知识工作者。全球大概有 10 亿。
Founder Park:这个赛道的市场有多大?
张浩然:首先,生产力市场本身是 600 多亿美金的规模,这是 SaaS 时代的标准市场。全球大概 2000 万个人用户、1500 万中小企业用户,按个人 30 美金 / 月、企业 200 美金 / 月的收费结构算,我们瞄准的 TAM(总体有效市场)约 660 亿美金。
但真正的机会不在这,在于我们一旦用个性化软件交付了价值的最后一公里,我们颠覆的其实是一个非常成熟的软件劳动力供应市场。这个市场非常庞大,无论是 IT 外包,还是微软、SAP 的实施供应商生态,规模都达到了几万亿美金级别。
当用户说一句话,就能生成想要的软件时,这种定制化的劳动力市场就会被替代。我们从几百亿美金的生产力市场先切进来,最终瞄准的是软件劳动力定制化市场。很多标准软件的长尾需求,仍然需要第三方公司通过类似于外包和定制开发的方式来解决,这个市场巨大。
Founder Park:未来会考虑纯粹按结果付费吗?
张浩然:今天大家都在谈按结果付费,但关键是怎么验证结果。你交付一份报告,用户不认可怎么办?至少目前来看,你生成了一个软件,用户认可并持续使用它,这本身就是一种明确的结果交付。这个事还在探索,但我个人希望能最终干掉 token 消耗模式,让用户可以不限量地使用。
Founder Park:创业、大厂这些经历对你现在的项目有什么帮助?
张浩然:帮助非常大。首先,在之前的职场工作里,一直是在用软件自动化解决庞大的业务效率问题,亲身经历过企业、个人、组织在这方面的痛点,我自己就是最懂这些痛点的人。
我第一次创业做的「住客云」,是一个 MarTech,本质是营销自动化,核心还是工作流;第二次创业做「啊哈时刻」,帮国外 SaaS 公司做用户引导,离不开流程和规则引擎的设计;后来去字节,负责飞书里的无代码表单和工作流系统,依旧在跟工作流打交道。可以说,我整个职业生涯都在和工作流深度绑定,对它的理解非常透彻。
特别是「啊哈时刻」这个项目,它是一款 Chrome 插件,我们需要通过它解构网站的所有 DOM 元素,再绑定规则来引导用户。这段经历让我积累了大量底层技术经验,现在大家常说的 Computer Vision、Browser Vision,甚至 RPA,本质上都是我们当时产品里用到的技术。过去识别网站元素的能力,现在正好能转化为生成个性化软件模块的能力,两者在技术上是相通的。
所以,在生产力这件事的理解上,我可能是中国最懂 IFTTT 模式的产品经理了。很多产品经理虽然也做过流程引擎,但他们没有真正扮演过企业里 CIO 这样的角色。而我恰好既在企业里承担过类似 CIO 的职责,深知业务运营如何与产品结合,又亲手做过抽象层的工作流引擎。
为什么我要坚持「干掉工作流」?因为我既懂工作流,又懂企业是怎么经营的,我知道一线运营人员脑子里在想什么。这些经历对我帮助非常大。
Founder Park:参与过两次奇绩路演,感觉国内的创业生态有什么变化?
张浩然:首先,现在资本整体还在寒冬,但我能明显感受到 90 后、95 后创业者的热情。21 年我做 SaaS 去奇绩时,是那期最年轻的创始人,大概 25、26 岁,当时整体平均年龄 31、32 岁;但这一期入选者平均年龄 28 岁,我 94 年的,今年 31 岁,几乎是前三大的,变化特别大。
21 年那波创业还是以 SaaS、生产力为主,AI 还没起来,大家的想象力比较局限;但这一波完全不一样,00 后创业者做的东西天马行空,比如 AI 陪伴玩具,有些我都理解不了,我主要还是关注生产力方向。
一个明显的感受是,创投圈换代了。21 年我加了 300 多个投资人微信,这次加了近 500 个,但只有 3 个是 21 年认识的。
Founder Park:对你来说,这个换代是好事还是坏事?
张浩然:我不知道,但体感上有回暖。21 年奇绩 Demo Day 后我没融到资,直到 22 年冬天才融,那会儿美元基金全面撤出,哪怕我做的「啊哈时刻」数据很好,一个月有上千家 SMB 客户、周留存 70% 以上,也没人敢出手。但这次不一样,我带着即将上线的产品演示,大家都很积极想推进,能感受到「暖意」。
Founder Park:回顾过去的创业经历,有什么经验可以分享,帮助大家少走弯路?
张浩然:一定要尽快推出产品。「啊哈时刻」那次,产品打磨太久,快没钱了才被迫上线,结果现金流断裂,公司倒了。
我们这波 AI 创业的人大部分都是产研驱动的,这是一个优势,但也要反过来意识到,最终能够证明你产品行不行的是市场。用陆奇的话说,「上帝来了都要踩坑」,所以本质是快速推出产品,快速验证,把大坑变成小坑,别掉到大坑里去。
创业别太执着「产品必须完美才上线」,哪怕没成品,也能用其他方式先验证:比如我这次创业前,先给公司做 AI 落地顾问,看咨询能不能卖出去;如果是 To C,先抛出观点看有没有人认可。要有验证思维,别憋大招、别过度理想主义。
Founder Park:明白,就是尽快面向市场,看市场的反馈。
张浩然:对。有时候即便市场反馈不好,但你拿到了反馈信息。不一定要调整,你也可以选择坚持,这不冲突。但你不能不面向市场,自己闷头憋,这是不对的。就算你一定要往那个方向做,你也得知道它可能在哪错。你可以不认可这个错误,但你必须知道今天你在这有一个问题,这个问题可能会影响它。
文章来自于微信公众号 “Founder Park”,作者 “Founder Park”
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md