去年 Anthropic 发布 Computer Use 的时候,引发了一次大家对 AI agent 的想象。
两个月后,OpenAI CPO Kevin Weil 在发布 Operator 时也说,2025 年将成为 AI agent 进入主流市场的一年。果然,最近密集涌现出了很多 AI agent 产品。
Manus 最早发布抢得先机,吸引到一波关注后,这几天又有三家 AI agent 产品出来。
一个是 AutoGLM 沉思,主打免费吸引用户,号称他们用 AI 孵化了一个 5000 粉丝的小红书账号,还接到了商单。
还有一个是 Genspark Super Agent,同样免费,据说是壮士断腕,砍掉了起步的 AI 搜索产品,转过来做 AI agent。
另一家是 rabbit 刚上线的产品 rabbitOS intern,直接定位于实习生角色,限时免费可用,r1 用户每天可用9次,非 r1用户每天可用3次。
我看到 X 上已经有很多人在分享他们用 rabbitOS intern 制作的成果,有人用它制作了一款可以在 r1 上玩的小游戏,还有不少好玩儿的案例。
rabbit 官方也展示了一些 rabbitOS intern 可以实现的任务效果,包括制作一个视觉识别的程序、一款小游戏、展示网页等案例,看起来很有吸引力。
之前我分享过让 Manus 整理 AI agent 行业的选题资料,完成得非常不错。
同样我也让 rabbitOS intern 试了试,15分钟完成,在稳定性、运行速度和交付成果上都比较让我满意。
但产品的一些细节交互体验还有待完善,比如对话记录暂时不能保存,任务过程中不能刷新网页等等。
不过对于 AI agent 这类产品来说,agent 的能力比交互似乎更重要一些。
这次 rabbitOS intern 上线后的表现也得到了海外大 V 的认可,加上过去一年 r1 进行了 30 多次系统升级,rabbit 的市场口碑开始扭转。
大家对于 rabbit 的印象可能还停留在他们最早发布的 AI 智能硬件 r1,其实过去一年,他们一直在探索 general AI agent 产品路径,比如:
拆分步骤,自行在浏览器中搜索、查询、执行,可以完成信息搜索、分析调研、网购等场景的任务
agent 学会之后便可以执行相应的任务
rabbit 在官网新闻稿中称,他们会把过去构建的所有 agent 套件升级后整合到 rabbitOS intern 中来,
包括 web 端、桌面端、移动端等,最终实现跨平台的 general AI agent 体验。
最近 rabbit 创始人& CEO Jesse Lyu 在一个播客里也表示,rabbit 的目标就是要构建跨平台的 general AI agent,
随着大模型在推理、规划以及代码级执行这三个方面的能力迅速提升,general AI agent 正在从技术构想快速走进现实。
不过,目前来看 token 成本依然是一个大问题。
在一个常见的任务中,往往需要拆解成几十、甚至上百个步骤才能实现,每一步输出质量的提升,都意味着成本的增加。
无论是成本与输出质量的平衡取舍,还是流程优化的降本增效,AI agent 都还有很大的探索空间。
之前有人测算过,这类产品涉及到多个 agents 的协同调用,即使把任务流程优化到极致,
为了保证基本的输出效果,平均执行一个任务所消耗的 token 量级会是 AI 问答的一百倍以上。还有人具体估算认为,平均执行一个任务的消耗金额在 5~10 美元。
这些推测因任务的复杂程度、输出的稳定性等等因素会有所出入,但大家推测的主要结论是,这不会是一个创业公司能够烧得起的数字。
所以在 token 价格没有大幅降低的情况下,收费是必然的结果,甚至不是一种选择。
前几天刚好 Manus 公布了收费机制,Starter-39 美元/月、Pro-199 美元/月。
估计 rabbitOS intern 很快也会开始收费,可以尽早去 https://hole.rabbit.tech/ 感受一下。(关掉🪜后使用)
或许还需要等到流量通信的资费足够便宜的时候,互联网生态才能真正繁荣一样,
general AI agent 虽然在不断涌现,但仍需等待,除了需要等待更强大的基础技术,更需要等大模型端更彻底的竞争带来更便宜的成本。
general AI agent 距离「DeepSeek」时刻,可能还差一个 DeepSeek 的出现,把 token 费用继续打下来,应用层才能迎来真正繁荣。
文章来自于微信公众号“投资实习所”,作者 :StartupBoy
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。
项目地址:https://github.com/mannaandpoem/OpenManus
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md