之前在X上看到过一个新加坡版的DeepSeek,叫Agnes AI,主打一站式Agent空间。
但当时我自己搞产品焦头烂额的,随手点开看了看,就放下了。
后来在Product Hunt上又看到这款产品,以及各种海外平台时而刷到。
终于,前段时间在WAIC,我见到了他们的创始人,还有他们即将发布的新功能。
这次让我觉得,当一款不错的产品第三次出现在我眼前,再错过、再忽略,就是我的问题了。
也许,这是一个能改变我对Agent的看法,或者能节约我人生里很多个小时的产品呢?
在新加坡被视作DeepSeek一般的存在,会名不符实嘛?
没想到两个即将上线的新功能,却给了我很不一样的惊喜……
https://agnes.life/
之前的图像生成像个“一锤子买卖”,还是简单的输入-输出。
但是现在,Agnes AI的Deep Design引入了完整的多轮推理机制。
我想让“设计一个科技新闻直播间的背景墙”。
指令发出以后,拆解出的设计大纲下面,有一个Deep Design按钮。
还有一个每次用我都喜欢的小细节,就是点中那个Go按钮,有一种类似游戏冲锋式的“Ready!Go!”的满足感。
执行过程会将多个细分任务并行处理,也就使得生成速度异常迅速——应该是我所有体验过的Agent产品中最快的。
那么效果如何呢?
除了静态的科技背景,还给我生成了动态效果,质感还是很满足预期的。
我还发现,不仅能用自然语言描述需求,还可以在生成的图像上直接进行手绘标注——
无论是圈出需要调整的构图区域,还是用箭头标明光影方向,甚至画上简单的替代元素轮廓。
Agnes 会将这些手绘信息进行矢量化解析,与原图的语义结构相匹配,然后驱动生成引擎进行二次渲染。
这种基于视觉指令的交互模式,消除了纯语言沟通的模糊性,让修改更精准、更贴近设计师的真实工作流。
整个的流程非常丝滑,这里我录成视频给大家完整看一看。
这里是设计一个并不存在的“末日地堡”。
整个过程被拆分为多步骤流水线:
首先生成初版图像;
然后调用一个或多个多模态 AI Agent,从构图完整性、主体与背景比例、色彩协调度、纹理细节解析度等多个维度进行质量审查;
接着针对检测出的问题,生成可执行的修改指令,比如“左侧留白过多,建议添加前景元素”或“材质细节丢失,提升分辨率并调整光照方向”;
随后系统会同时生成多个改进版本,并通过图像质量评估网络(IQAN)在语义一致性与视觉美学分值上进行排名,选出最优版本;
最后再将其与初始文本描述进行一致性验证,确保需求与产出精准匹配。
再给大家看一个设计的未来阅读器,也是基于以上过程,多步骤、多任务并行完成。
就很类似专业设计团队的闭环协作:有审稿人、有修改建议、有候选方案、有质量复检。
最终的结果呈现,不仅快,而且好!
Wide Research 则把“并行计算”理念搬进了知识工作场景。
用户可以在一次查询中调动上百个专用 AI Agent,每个 Agent 专注于一个子任务——
比如说,学术Agent负责检索并提取最新论文的关键结论;市场Agent追踪竞品动态并生成对比矩阵;
政策Agent解析监管文件中的重点条款;数据Agent调用API抓取并清洗公开数据集。
比如我想用 Wide Research “广”的能力,详细盘点一下硅谷华人圈有哪些AI科学家。
分析逻辑非常清楚。
接下来则是直接给我了一个大名单:
然后是更细分维度的人员盘点:
所有结果会实时汇聚到中央协调模块,进行去重、分类、优先级排序,并以结构化知识库的形式呈现给用户。
体验下来,除了结果可靠,再用一个字形容,就是“快”。
这种多Agent协同的架构,不仅在速度上远超传统串行调用,更在信息覆盖广度、交叉验证的深度上,接近专业分析团队的水准。
像Manus也有类似Wide Research的功能,但即便是Manus的快速模式也明显花的时间更长。
相比 Manus 等工具,Wide Research 在多线程调度、上下文缓存优化、以及跨领域信息融合能力上都有显著优势。
单看同样的关于“盘点硅谷华人科学家”的任务,就能很直观看出信息量的巨大区别。
我还尝试了一个“马来西亚市场拓展”的调研分析,也是类似的情况。
这次 Agnes AI 则是给了我详细的图表,完成度几乎可以说胜过市面上各大Agent产品。
类似的产品条理也挺清楚的,只是参考价值、信息增量就小很多了。
更重要的是,Wide Research 的成果可以无缝导入 Deep Design 流程。
就好比说,一个品牌营销团队可以先用 Wide Research 获取全球同类产品的视觉风格与市场反馈数据,再直接交给 Deep Design 2.0 进行风格迁移生成;
学术团队则可以先让 Wide Research 整理最新研究趋势与关键数据图表,再在 Deep Design 中生成对应的视觉化海报或演示PPT。
这种研究与创作的连续性,消除了工具切换带来的上下文丢失和时间消耗,让AI真正成为协作过程中的中枢神经。
在我看来,Agnes AI的核心价值恰恰就在于:
它从来不打算把“AI能力”当成独立技能点来卖,而是把这些能力作为“流程节点”融合到真实团队协作里。
在如今AI工具满天飞、噱头泛滥的世界里,我总会问自己:到底哪一个AI产品,是真正从一开始就为“人”设计的?
不是为了炫技,不是为了堆功能,而是真正回到用户协作场景、落到真实使用路径。
去思考 AI 应该如何与人共创,如何嵌入团队,如何不成为另一个累赘工具?
Agnes AI,也许正在交出这个问题的一个答案。
这款来自新加坡NUS系统孵化、由技术创始人 Bruce 领导的协作式 AI 平台,正试图做一件不太时髦、却极其重要的事情:
把AI从碎片化的点工具,打磨成真正的一体化协作空间,从生成内容到共享知识、从设计图像到产出幻灯片,彻底消灭你在内容创作中的“中间步骤”。
从Deep Design到Wide Research,它是一次深度整合。
而且回过头看,之前已经上线的几个功能也可圈可点。
它不仅能生成图像与视频,更关键的是,这一切都可以基于“研究内容”来驱动——
可以先让 Agnes AI 做 Deep research,然后让它自动生成图片,紧接着一键生成PPT。
PPT的质感非常有国际范。
文字、图像、结构、逻辑,全线打通,协作即创作。
不是“Canva + ChatGPT + Notion + Slack”的拼盘,而是一个从底层打通、为协作而生的 AI 系统。
我们正在见证一类全新的工作方式的诞生:生成不再是终点,而是协同的起点。
在产品快速进化的同时,Agnes 也交出了一份漂亮的增长答卷。
截至目前,平台日活已超 2 万,并持续增长。且活跃度高、分享率强、留存率优于行业平均水平。
在此背景下,Agnes AI 正以 1 亿美元估值进行新一轮融资。
创始团队正在考虑提高估值,以争取更大的资本储备,加速全球扩张——特别是在日本、东南亚与北美市场的部署。
值得一提的是,Agnes 并没有走内测+邀请码式路线,而是每发布一个新功能,就直接对所有用户开放注册、所有功能全面可用。
没有排队、没有暗门、没有提前筛选——每个人都能直接体验完整版本。
这份开放姿态,本身也是一种产品自信。
在 Agnes 身上,有一个细节让人印象特别深:它的技术实力不是拿来装门面的,而是真正在每一次迭代中发挥价值。
而这种“技术为用”的思维,正来自于创始人 Bruce 本人。
他是典型的技术创业者:成长于新加坡NUS孵化体系,既做过算法研究,又带过工程团队。
他在今年的世界人工智能大会WAIC上做了演讲,呼吁人类与 AI 的互动不该是黑箱协作,而应该是“理解 + 指令 + 执行 + 反馈”的正向闭环。
也在新加坡举行的全球 AI + Robot 交流圆桌会议中分享了团队在设计 Agnes 时对“多模态输入+语义反馈”的系统化思考。
有些公司喜欢嘴上说“算法、技术驱动”,但Agnes AI是写论文、跑工程、开源实现、反馈到产品、再进一轮优化的全栈路径。
财经杂志、MoneyFM、Dollars&Sense 也都报道过 Bruce 与 Agnes 的产品理念与市场表现。
Agnes 想做的不是“一个更强的工具”,而是“一个值得信任的协作伙伴”。这背后,是创始人对人与工具关系的深度思考。
在 AI 技术迅猛发展的当下,一个产品是否值得关注,已经不再取决于它能不能生成更炫的图片或做出更花哨的视频,而是它有没有真正将 AI 融入人类真实工作流,做到自然、可信、高效的共创。
Agnes AI正在这条路上,用务实的系统设计、硬核的技术实现和清晰的产品理念,为 AI 协作空间立下标杆。
没有炫技,只有协同。
它可能不是你看过最热闹的 AI 产品,
但它有可能,是你真正愿意长期依赖的那个。
文章来自于微信公众号“AI异类弗兰克”,作者是“FrankGPT”。
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。
项目地址:https://github.com/mannaandpoem/OpenManus
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales