2025年上半年,Agent成为大模型领域讨论最多的主题之一。
在这波Agent浪潮中,产品已然形成两大阵营:专注特定领域深耕的垂直型Agent,和试图覆盖全场景的通用 Agent。这场"谁才是Agent 的终极形态"的争论或许为时尚早——底层模型能力才是产品能力的真正瓶颈:通用型难称全能,垂直型的深度也受限。
当下对用户决策而言,更为关键的是:Agent能否精准地嵌入工作流程?提供的价值是否配得上用户付出的费用?当试用期结束,用户是否会自发认可其不可替代性?
抛开技术路线之争,回归实用视角。腾讯科技将实测现在最热门的三个产品:Manus、Flowith(Agent Neo)、Lovart,展示它们的最佳使用场景,为读者提供一手的实用参考。
虽然Manus和Flowith同为通用型Agent,但Manus更像可以独立交付成品的“数字同事”,主打把任何想法直接穿过浏览器、终端、代码编辑器等一整套工具链,自动分解为子任务并跑到结果落地。
而Flowith(Agent Neo)则更强调“可视化协作”及无限步骤:无限画布里一次对话可以开出多条并行线程,团队成员把素材、评论和分支随手拖拽,Oracle Mode 会动态重排优先级、持续几千步完成网站、小程序或 3D 互动页面的制作。
Lovart深度垂直于设计场景,它像一支外包工作室,把用户需求拆成主题、风格、素材、排版四段流水线,再调用图-动-声多模态模型,把 Logo、海报、短视频乃至印刷刀版一次性产出,并保持图层可编辑、可直接导入 Figma 及 PS 继续精修。
Manus的“交付型”能力最适合需要完整成果物的知识工作:市场研究报告、财务模型、长篇法律备忘录都能在十分钟级别跑完并附带引用和源文件。
Flowith擅长信息量巨大且需要多人迭代的创作场景:比如我们把千页文献或社媒数据导入“知识花园”,系统实时检索、标注并在画布上呈节点关系,开发者还能直接在同一平面协作,让“想法-草图-产品”在一个界面里闭环。
Lovart的重点则在高附加值的品牌视觉与内容营销上,比如创作者用一句话请求“为植物基护肤品牌做某社交网站的启动宣传方案”,它便按品牌色、排版模板、社媒尺寸一键输出五张海报和 30 秒预热视频。
我们把关键信息总结到了下面的表格中:
在这个场景中,我们用了两个提示词来对比简单的创意场景下的展示效果。
由于Lovart、Manus调用的底层模型均包含GPT-4o,所以为了测试的完整性,我们也使用了GPT-4o作为对比。
从最终的生成效果来看,大家不分伯仲,且风格十分类似。但在图片的质感和图文混排效果上,Lovart要优于Manus、Flowith及GPT-4o。但是GPT-4o的生成速度,要比这三个 Agent 都快。
简洁而富有创意的广告,背景为干净的白色背景。
一个真实的[机器人]被融入到手绘的黑色墨水涂鸦中,线条流畅,趣味十足。涂鸦描绘了[AI Real]。在顶部添加粗体黑色“[We Are Friends]”字样。将[AI]的标志清晰地放置在底部。视觉效果应简洁、有趣、对比度高,且概念巧妙。
提示词二:
设计一个巨物崇拜风格的图片,比例9:16,风格神秘,并有故事感
三个 Agent 因为底层模型一样,生成图片的风格都比较类似。
其中,中文图文混排能力Lovart的最强,文字清晰、在整个构图中显示和谐;Manus的文字会压在图片上,有一些中文错乱;Flowith整体表现中规中矩;基础模型GPT-4o的中文显示会出现错乱。
在风格统一性上,Manus和GPT-4o的风格最统一,Flowith 其次。
这次我们用英文Prompt进行测试,要求 Agent根据提示词的要求,输出完整的数字巴洛克风格的设计,应用场景为品牌推广、线上虚拟服装宣传以及社交媒体宣传。以下为Prompt原文,提出了内容主题、风格、颜色、质感、尺寸。
提示词:
Content:
Theme: "Digital Luxury and Future Fashion." Combines Digital Baroque and trendy fashion to showcase virtual clothing, digital models, and futuristic accessories, conveying a bold and luxurious brand identity.
Style:
A mix of Digital Baroque and modern trends with intricate 3D patterns, futuristic geometric lines, and dynamic lighting.
Color Palette:
Deep metallics (rose gold, bronze) + vibrant neon hues (electric blue, fluorescent purple, neon pink) for strong contrast.
Mood/Material:
Dreamy, surreal, with materials like digital metallic textures, holographic gradients, and glossy glass effects.
Proportion/Size:
16:9 HD horizontal, optimized for mobile screens.
Usage Scenario:
Perfect for digital fashion branding, virtual clothing promotion, and social media campaigns.
Lovart返回了三张图片,分别是一张身穿巴洛克风格服饰的模特、巴洛克风格的配饰、巴洛克风格的背景。在最终的界面中,我们也可以选择对图片进行二次编辑。在顶部的工具栏中,可以进行扩图、消除背景、增加某些配件等操作。
图:Lovart输出的结果
Manus的最终交付结果只有一张图片及文字说明,但是图片的质感不错,风格也符合数字巴洛克。
图:Manus输出的结果
在这次实测中,Flowith的输出超出预期,它给自己疯狂加活,在自由画布中,对数字巴洛克风格进行了超级详细的分析,最终生成了10张图片,和一个带有交互的网站页面,以及网站的源代码。
图:Flowith输出的结果
图:Flowith生成的网站
给出Agent一个综合性的任务,通过一段提示词引导它完成复杂的目标。任务示例:模拟一家初创饮料公司,仅提供一句品牌定位口号,避免过多信息干扰,要求Agent在一次对话中完成提示词中列出的所有内容。
角色:你是品牌设计总监。
目标:用一句话“银河柚气——把星空装进汽泡”完成如下交付:
1. 生成 Logo、三色配色、两张 A3 竖版海报排版;
2. 制作 15 秒竖屏开屏视频,含品牌 Slogan 动效与原创配乐;
3. 输出 TikTok 发布脚本(3 段)和 7 天发布时间表;
4. 提供 Figma/PSD 源文件下载链接。
Manus输出了一个压缩文件包,文件包中包括了品牌logo和配色方案、A3竖版海报、15s的开屏视频、一个有动态展示效果的网页(HTML5版本)、TikTok营销方案。
但是,只提供了Figma/PSD结构说明,并没有可下载的源文件或源文件链接。这个要求其实十分复杂,Figma 和 Photoshop 的源文件就像是包含所有设计步骤和可编辑元素的复杂“工程蓝图”,而 AI 目前更擅长画出“最终效果图”(比如一张图片),还很难直接创造并打包这种结构极其精密的“蓝图文件”。Manus将这个蓝图如何设计进行了详细说明,也算是完成了任务。但是,最终的展示效果还比较半成品,可能还需要多轮修改。
图:Manus输出的网页效果
Lovart交付结果如下图所示,TikTok的营销方案是用一张可视化的图呈现出来,并生成了一个可以动态展示的网页。同样没有生成可以下载的Figma 和 Photoshop 的源文件,但是生成了多张图片,从背景到主体都覆盖,可以用顶部的工具栏进行二次编辑,或者是下载下来,用PS等软件进行二次编辑。视频也展示出了把星空装进气泡的动态效果。整个方案的完成度比较高。
宣传方案网页:
Flowith最终的交付物也是缺少了 Figma/PSD 源文件下载链接,在最终的视觉呈现上,有比较浓的GPT-4o感觉。视频生成有些偏差,没有呈现出与饮料的关联,和之前的主视觉色调、风格不太匹配。
文字版配色方案:
主色 宇宙深蓝 #0A1F3C 象征深邃浩瀚的星空,奠定品牌的科技感和梦幻基调。适用于大面积背景、品牌文字主色,营造沉稳、神秘的视觉效果。
辅色 气泡银 #C0C0C0 代表汽泡的跳跃和光泽,强调饮品的活力和清新口感。适用于Logo中的气泡、辅助图形元素,以及与宇宙深蓝搭配使用,增加层次感和时尚感。
点缀色 柚子黄 #FFD700 提取柚子色泽,象征清新自然的果味,为整体配色注入活力。适用于Logo中的柚子元素、重要信息突出、以及与深蓝和银色搭配,形成视觉焦点。
图:Flowith生成的宣传视频
深度研究场景中,Agent的核心竞争力在于一套相互衔接的"长链"能力:将模糊主题分解为可执行步骤,在海量信息中精准检索融合,为结论提供可验证来源,并能在执行过程中自我纠正。
只有这些能力形成闭环,Agent才能应对持续数十分钟、涉及上百操作的复杂研究任务。因此,能力强大的Agent产品必须整合长程规划、超长上下文理解、增强检索、工具调用、自我反思和可信溯源六大核心能力,构建一个可靠且可扩展的系统,以确保在复杂研究场景中的输出既准确高效,又可追溯验证。
由于Lovart是专注于设计能力的Agent,在这个场景不适配。我们重点评测了Manus和Flowith。
以下为实测案例:
调研Claude 4可以连续编码7小时,Flowith可以超长上下文+持续自制,这背后的主要技术原理是什么?在基础模型仍然有上下文限制的情况下,这是如何做到的?大模型的长程自自治对人类的意义是什么?智能体的长时间工作能力,在之前从未被作为一个评测模型或AI产品的指标,为什么现在被持续提及。联网调研arxiv等网站,查看相关论文,是否有相关论述?从社交媒体、机构媒体上,看行业内的Kol如何表达。输出一个完整的报告:需要有基本原理的解读、产业的实用意义、目前的卡点、未来的发展路线研判。
Flowith和Manus的耗时差不多都是5分钟左右。Flowith生成了12375字的最终版报告,以及32个节点文档。
Manus生成了最终12813个字的最终报告,以及9个拆分主题的文档,比如技术背景研究。
从最终生成的深度报告质量来看,两个Agent难分高下。但是,他们不同的工作过程和工作原理,可以让我们使用到不同的场景中。
Flowith 和 Manus 都能把“先检索、再推理、再执行”整合进一条流水线,但它们的实现侧重点不同:Flowith 依赖“Oracle Mode + Knowledge Garden”把大量原始资料沉淀到可视节点,再以几千步的无限链条完成深度分析;
图:Flowith的工作界面
Manus 强调“浏览器/终端/代码编辑器”三合一工具编排,追求把研究结果直接变成可交付成品。
图:Manus工作界面
当研究材料海量、需要多人协作并频繁迭代时,Flowith 的“知识花园 + 可视链”更合适。
如果我们更看重快速产出、结果必须落地为网站、脚本或成品文档,且数据合规风险可控时,Manus 的工具编排会更省心。
若场景既要求超长上下文又需本地或私有云部署,当前两个方案都不够完备,都需要混合自主检索框架或专业研究代理补位。
Lovart 仍处于邀请码免费试用阶段;Flowith 将入门订阅定在 19.9 美元/月;Manus 5 月 13 日开放注册后,基础版定价为19 美元/月,与 Flowith 看齐。按当前汇率折算,这一价位一年约需 1700 元人民币。
对不同用户群体而言,同样的价格意味截然不同的决策逻辑:
普通用户以轻度体验和兴趣驱动为主,只有在某项功能显著提升个人效率时,才会考虑从免费转向付费。
专业用户(内容创作者、自由职业者)把高质量输出与稳定性视为刚需,如果工具能节省制作时间、提高交付水准,则 20 美元级别的月费相对容易接受。
B 端用户(团队、企业)更看重安全合规、权限管理和 API/工作流集成;只要产品在这些环节可靠,月费并非付费的阻碍。
因此,决定性拐点可能不在于模型性能再提升几个百分点,而在于产品能否凭明确的效率红利,把“好奇心流量”转化为“月复购 GMV”。只有当个人或小团队心甘情愿地把每月的“咖啡钱”变成“Agent 提效费”,这些 Agent 产品才算真正迈过商业化门槛。
图:Manus价格
图:Flowith价格
本文来自微信公众号"腾讯科技",作者:晓静.
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。
项目地址:https://github.com/mannaandpoem/OpenManus
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0