本来是不想写这篇文章的,但是近两天看了几家写的,要么浮于表面,要么错误连篇,本少女就按耐不住了,写了下我对 coze、扣子、GPTs的理解,欢迎大家来我们的 Agent 交流群探讨。
在文章开始之前,抛出三个疑问,想跟大家探讨。
1. GPTs 算是 Agent 吗?那 Coze 做出来的智能体算吗?
2. 为什么 OpenAI 下架了插件市场,而字节却在不断填充自家的插件?
3. 扣子搭建智能体时,Flow 这种形式,价值点在哪?
怕新来的朋友比较懵逼,本少女先来简单介绍一下~
Coze 是字节出海的产品,访问地址为 coze.com,扣子是字节2月1日在国内上线的产品,访问地址为 coze.cn,在一月底我写了另一篇文章:字节的Coze又低调更新了!,主要是介绍的海外版的 Coze,感兴趣的朋友可以回看一下。
我简单梳理了一下coze、扣子和GPTs产品功能上的区别。
使用门槛上,GPTs(需要充值plus)> coze(需要IP在国外)> 扣子。
功能复杂度上,coze > 扣子 > GPTs。
首先在我看来,GPTs 并不算 agent,优雅的说,可以算是agent的雏形。至于什么是 agent,去年年底我们做了一个图谱,先给大家看看。
Agent 应该是有能力主动思考和行动的智能体。当用户提出需求时,agent 有能力自行感知环境、形成记忆、规划和决策行动,甚至与别的 agent 合作实现任务。而用户每 Prompt 一次才被动回复的 GPTs,还没有达到 agent 的标准。事实上,国内很多厂商做的都还不是 agent(智能体),只是炒了一波概念。
严谨的说,扣子做出来的智能体,比 GPTs 更加接近真正的 agent,也让大众更低门槛的具象的能感受到 agent 的结构与结果。在扣子中,LLM被弱化成了比较小的一环,并加持了插件、工作流、知识库、定时任务等等工具,别人有的我要有,别人没的我更要有。
OpenAI是要做AGI的,而扣子更像是字节内部的一个基础设施。过多的插件反而会增加用户的使用门槛,最理想的情况下,就是用户通过自然语言提出需求,GPT就能真实解决。
但字节这边不一样,扣子对于字节而言就像是个武器库,或者说是幻兽帕鲁里的工作台,在有需要时,能够低门槛、多选择、可视化的搭建针对特定场景功能的智能体。
又或许插件只是一个过渡期,在早期能通过用户数据,pick 出最好的插件。
在做 agent 平台这件事情上,相比于很多亦步亦趋的AI公司,OpenAI 和字节给出了不同的思考。
在扣子上线的当天,我们做了一个知识库,还做了一次线上分享。
没想到支持的同学如此多,不到一周,访问人数已经有两千多人。
知识库包含了一些重要的资讯和教程,还有群友共创的案例,比如群内吕大佬就做了这样一张图谱。
我们还邀请了一位重磅嘉宾,来做了一次关于 coze 和 agent 的主题分享。
Langflow 和 ComfyUI 开源,flow 也在质疑声慢慢走了出来。
我个人是十分热爱 flow 这种形式的,优雅且易用。
OpenAI 的 AK 最近也发推,提到了“Flow engineering".
其中本少女的一位朋友,猴子无限的创始人,也是flow的拥趸,最近提出了“Coze必定失败”的观点。本少女境界还不够,不做评价,留给大家思考。
????为什么以 Coze 为代表的产品一定会失败,或者至少要完全推倒重来。
1️⃣一个产品在设计之初,对未来的想象将成为产品最核心的地基。
如果相信未来电力会作为主导,那么就应该做电动汽车;如果相信未来石油仍然是主导,那么就应该继续做油车。
2️⃣产品的地基和基于地基继续建设的夹角将决定最终产品的熵。
如果地基不稳,每往上盖一层就需要瞻前顾后检查一轮并且在不该做额外支撑的地方付出经历;如果建设高度在地基规划时就已经确定没有问题,盖楼过程会又快又稳。
3️⃣好的产品要帮助用户看到未来和驶向未来,而不是相反。
福特、乔布斯、马斯克等最伟大的创新者验证过的思路是,“用户以为他们想要更快的马,但是其实他们需要汽车”。
这一代的产品不能只看到“更快的马”,更不应该以“用户适应了马”为理由在明知道火车更先进的时候,去给用户一套马拉火车的产品。
很多时候我们看到市场上有长成“火车”面貌、调动大量市场资源的新产品。
但是这些依葫芦画瓢的产品缺少对未来十年“火车”的想象,缺少对“马”和“火车”谁好谁坏的审美,为“马”建立产品地基但为了时髦让“马”拉上了“火车”。
让我来尝试讲一讲猴子无限在做的事情:
1️⃣我们对未来的想象建立在智能体将会覆盖我们全部数字世界和物理世界的工作,核心是以流程为中心的对任务的规划和执行。
2️⃣我们要保证我们当下写的每一行代码到那个时候不会被弃用反而成为那时候的基础设施,核心是一套图灵完备的流程调度的机制并对其中每个节点的状态充分可观测。
3️⃣我们认为模型选择、预置提示词、多轮对话配置应该包含在流程中而不是流程作为一个涉及复杂配置时才使用的插件和补充项。
对应的,我们围绕流程构建和流程调用提供了全链路的工具链,让用户配置流程和使用流程不是挑战而是享受,并且受益于极致的产品设计(保证在一个流程配置页面中可以搞定所有事情,而不是为了看起来的简单使用在页面中多个地方进行跳转)
“有人把AI当作工作,有人把AI当爱好。
而我们把AI当作生活。
很高兴在通往AGI的路上遇见你们!”
文章来自于微信公众号 “ 特工宇宙”,作者 “ 特工少女”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0