仍旧记得 2023 年微软发布 Office Copilot 时,我的朋友圈很多人都无比兴奋,大家看到了 Office 和 AI 结合带来的种种便利。当时我也觉得挺酷的,沉寂多年的 Office 系列终于开始往前走了一步。
但两年过去了,身边真正用起来的人并不多,除了几个外企工作的朋友偶尔提起外, Microsoft 365 Copilot 的存在感其实挺弱的。
原因也简单:微软的做法,本质上只是给传统 Office 套了一层智能外壳,零星的加了几个看起来激动,实际使用后却一言难尽的功能。锦上添花而已。当时大众趋之若鹜,更多还是新鲜感税。
Copilot 看似智能,但没从根本上改变工作方式,更没有从 AI 的底层逻辑出发,重新思考一套真正适应团队协作场景的工作流应该是什么样。
最近,我在 Product Hunt 上发现了一款产品:Agnes AI。
相比之下,这款创业产品虽然没有 Office 成熟,但它完全重新基于 AI 思考了新一代的 Office 应该是什么样。从介绍中,能看出来他们团队的野心:想用 Agent 的逻辑打造全新的协作 workspace。
Agnes 对现有办公工具的改造,比微软那种简单叠加智能插件的做法更彻底。它没有停留在工具拼接或表层集成,而是把所有工作内容和协作流直接整合进一个统一的入口。
团队不用在多个窗口和应用之间反复切换,输入、协作、进展都沉淀在一个有记忆的协作环境里。
它有三个亮点:
下面简单演示下具体用法。比如我要做一份关于特斯拉人形机器人 Optimus 最新进展的 PPT,常规操作一般是,先用 ChatGPT 或 Kimi 这类工具查找资料,生成一份报告,然后手动整理成大纲,最后再用专门的 PPT 工具把内容转成演示文档。
在 Agnes 里,这一套流程可以直接合成一条线。我只需要在输入框里提出需求,比如帮我梳理下特斯拉人形机器人 Optimus 的最新进展。剩下的,Agnes 能够理解我的意图,并执行任务。如下图,我还可以上传本地文件,以便 AI 参考。
后面的流程,Agnes 会自动衔接。先生成结构化大纲,需要的话可以手动调整。大纲确认后,系统会调用搜索工具查找并整理相关资料,收集到足够的信息并完成结构化后,再调用 PPT 生成工具把内容一张张转成 PPT 页面。
生成好 PPT 之后,我可以直接在界面中修改内容,也可以用自然语言在右侧的 ChatBot 窗口中,快速调整排版、删减页面,或者邀请它增加其他方向的内容。在这里,我们能真正体会到,什么是 AI 原生的产品。Agnes 把 AI 融入到了产品的所有环节。
通常,做好一份 PPT 外,还有一个强需求就是邀请同事一起 Review。比如我的这份 PPT,必定要给内容编辑看看是不是有什么疏漏之处。
以前用过的大多数 AI 工具,都是内容生成后导出文件,再发给同事,后续的修改、协作只能在线下完成,流程比较割裂。
在 Agnes 里,我可以直接邀请同事进来一起编辑,大家实时协作,遇到需要补充或修改的地方,直接批注、评论就行。收到同事的建议后,我可以让 AI 来处理这些修改意见。
整个的协作流程,确实非常之顺滑。虽然 UI 还有很多地方需要精细打磨,但整个的雏形已经让人足够兴奋。
查资料时顺便看了下团队背景。Agnes 的班底确实扎实,核心成员里有五位博士,基本都是新加坡国立大学、南洋理工大学这些顶尖高校出身,做底层算法和工程的经验很丰富。
CEO Bruce Yang 本科在 UC Berkeley,毕业后进了微软,之后去了 LinkedIn,主导过会员付费等关键业务,始终在做产品和技术相关的事情。
也许正是因为有这样的技术背景,所以他们做 AI 应用时,方法也很第一性原理:不是先堆功能,而是把新一代协作平台应该是什么样的目标想明白,再围绕实际需求自研模型和 Agent 框架。
这或许也保证了 Agnes 在产品上的竞争壁垒,他们不是简单的应用套壳。
我早说过自己的观点,对于这种 Office 级别的机会,如果创业公司不从底层开始做起,那迟早会被大公司按在地上摩擦。
Agnes-R1 是他们自研的一款 7B 推理模型,设计初衷就是针对团队协作场景。它支持长上下文,可以记住项目前后的关键信息,也能和多个 Agent 分工协作,适合处理团队里那些涉及多轮推理和资料整合的复杂任务。
如下图,Agnes 的产品和模型交互时,除了喂给模型用户的输入外,还包括共享的团队记忆、项目的 Context。
Agnes-R1 会结合 Context 和任务目标,调用自研的 Code Agents 框架把任务拆分出去,让不同 Agent 分工处理,最后再收敛出统一结果。
CodeAgents 是 Agnes 团队自研的多智能体推理框架,主攻的就是目前大模型团队协作里的几个痛点:分工混乱、流程割裂、Token 消耗高。
市面上很多多 Agent 协作,其实就是让智能体反复对话来推进任务,一旦链路一长,沟通全靠自然语言来回传递,既低效又浪费 Token,遇到复杂项目还经常失控,最后光花钱买 Token 了,任务进度反倒没跟上。
CodeAgents 换了思路,把所有智能体的分工、流程、工具调用、异常处理都用一套结构化伪代码写清楚,相当于把原来松散的对话流转成一套可追溯、可复盘的任务链。
每个 Agent 做什么、任务怎么分、工具怎么调、哪里出问题、如何回滚,全在代码层面有明确分工。这样一来,链路就像工程里的流水线,不容易乱,遇到故障能马上定位,后续要复用或扩展也方便。
框架三层结构很清晰:
实验证明,CodeAgents 在多个公开基准上都跑出了更高的任务完成率和更低的 Token 消耗。比如 GAIA、HotpotQA 这些需要多步推理、跨工具协作的 benchmark,CodeAgents 相比自然语言 prompt,Token 成本能省一大截,准确率反而更高。
在 VirtualHome 这种长链路仿真环境下,任务成功率提升近 20%,token 消耗少了四成左右,连成本和算力压力都一起解决了。
这背后其实就是技术路线上的分野。很多 Agent 系统还在拼 prompt、搞多轮对话,token 花得多,维护起来还费劲。
CodeAgents 用结构化方法做了工程化,本质是让大模型的推理和任务分工变得清晰、可控。对做真正 AI 协作平台的团队来说,这种底层能力,是比花里胡哨的功能更有分量的竞争力。
特别是他们通过这套技术直接降低了 Token 成本,这是一个非常关键的要素。现在市面上很多 Agent 产品,定价都不低,但仍旧无法盈利。
除了用户规模的问题外,一个重要因素就是 Token 成本太高了,大家都把钱,源源不断的送给了 Anthropic 这样的模型厂商......Token 成本,也就意味着它在成本这块和其他竞品相比拥有了巨大的优势。
下面的链接是关于 CodeAgents 的论文链接。这个团队真是强技术背景,我看到论文的第一作者,就是公司的 CEO Bruce Yang。
所以,相比其他的同类 Agent 产品,Agnes 的一个优势就是有自研的模型和 Agent 推理框架,他们构建了端到端的体系,这样不仅能够降低 Token 的成本,而且还能够提高内容的生成质量,不是简单的套壳。
https://arxiv.org/abs/2507.03254
过去十年,办公软件和企业协作市场表面上一直在进化,但真正的范式转变并不多。AI 插件、自动化脚本、新瓶装旧酒的效率工具,说到底大多只是让流程更顺滑,底层的协作结构其实没怎么变。
大部分企业还是靠不同厂牌的工具拼凑信息流,内容割裂、进度断档、知识复用低效,这些都是协作里的老毛病。
像 Agnes 这样的产品,尝试的是另一种路径。一开始就没打算给 Excel、Word 加点智能外壳,而是真正以团队协作为底盘,把 AI 深度嵌入到内容生成、流程分工和记忆沉淀的每个环节。
它关注的不是提升单点生产力,而是要重构组织级的知识流转和项目协同方式。
这条路其实一点都不轻松。从产品、模型、Agent 框架到工程体系,全都要自己打穿,难度远比做个工具型应用要高不少。真正的挑战,是怎么让这些底层创新落到企业日常协作里,变成能用、好用、愿意用的系统。
Agnes 现在还只是一个雏形,但从技术到产品理念,确实踩在了行业变革的门槛上。
新一代 Office 究竟会是什么样,现在没人能说清楚。但很显然,新的挑战者已经悉数登场。
文章来自于“AI产品阿颖”,作者“阿颖”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0