一手体验首款通用Agent产品Manus

一手体验首款通用Agent产品Manus - 唯有惊叹。

8646点击 2025-03-06 12:08

昨天夜里，深夜惊雷。

一个新团队突然发了一个首款通用行的项目：Manus。演示在此，我人直接看麻了。

一手体验首款通用Agent产品Manus - 唯有惊叹。

看完我的第一感觉，卧槽，人类又要一败涂地了。

这尼玛，就是OpenAI的DeepResearch和Claude的Computer Use的究极集合体，甚至，他还能自己写代码，直接Coding Agent。

这特么是什么怪物啊。。。

我预想到这一天会来，只是没想到，来的如此之早。

Manus在GAIA的评分上，也非常的离谱。

一手体验首款通用Agent产品Manus - 唯有惊叹。

已经超越OpenAI的DeepResearch的了，成为GAIA评分第一。

可能很多人不知道GAIA是个啥，我简单说一下。

GAIA（General AI Assistants）是一个面向通用AI助手能力的基准评测体系，由 Meta AI（FAIR）、Hugging Face 等研究团队于 2023 年提出。

有一篇非常著名的论文：

一手体验首款通用Agent产品Manus - 唯有惊叹。

里面有466个精心设计的问题。

传统的测试一般都是数学（AIME）或者一些专业知识问答、编程等等，但是GAIA测试，里面很多都是概念简单，但是需要多步骤解决的实际问题。

其中分为三个级别，Lv.1、Lv.2、Lv.3，难度依次递增。

想通过GAIA的测试，一般需要网络检索能力、工具调用能力、编程能力、文件处理能力等等。

在23年的时候，人类一般能达到90%的成功率，而那时候的最强AI GPT4，在第一级才勉强达到15%。

再看这张图，你就知道，有多强了。。。

一手体验首款通用Agent产品Manus - 唯有惊叹。

说实话，我目前还愿意为ChatGPT每个月都氪200刀，主要就是o1 Pro和DeepResearch，这两玩意有一说一，在我做一些研究和需要强推理任务的时候，还是非常好用的。

而Manus这波，把DeepResearch干碎了，要知道，它之前已经是最强了。。。

Manus网址在此：https://manus.im

现在有个很难顶的问题是封测中，所以只有邀请码的用户才能体验到。

所以，我也动用了我的人脉，花了十分钟的时间，联系到了Manus团队的人，非常幸运的获得了邀请码。

一手体验首款通用Agent产品Manus - 唯有惊叹。

不过，即使是没有拿到邀请码的用户，也可以去他们官网，大概看一下他们的Use Case，每一个，都非常的有意思。

一手体验首款通用Agent产品Manus - 唯有惊叹。

而如果你有了邀请码，正常登录进去以后，就是一个大大的界面：

一手体验首款通用Agent产品Manus - 唯有惊叹。

虽然都是一个对话框，但是Manus的能力还不太一样，他不是那个你提出个问题，AI一会就会直接给你回答Chatbot。

而是当你提出问题之后，他会根据你的问题和要求，来拆解任务，进行极度复杂的任务规划和执行。

并且会在云端自动运行，你可以直接退出出去，等运行完了，会通知你。

比如之前的那篇GAIA的论文，我想把PDF变成一个能拿出去讲的PPT，我把这个要求提给Manus的时候。

他会先把我的需求拆解。

我是这么说的：

1. 我希望你写一段Python程序，用OCR把这篇论文的PDF信息提取出来。

2. 将PDF里面的信息总结成PPT大纲。

3. 按照小米发布会的风格，做一份给普通人科普用的PPT。

4. 给我PPT的下载文件。

他会开始花一点时间来理解。

一手体验首款通用Agent产品Manus - 唯有惊叹。

然后，在右边的窗口上，运行一个虚拟机，准备开始执行操作。

一手体验首款通用Agent产品Manus - 唯有惊叹。

在虚拟机开启之后，会第一时间，列一份To Do List。

一手体验首款通用Agent产品Manus - 唯有惊叹。

然后，就会开始执行第一个任务，安装python库。

完成的项目，会全部在右边的预览窗口打x。

一手体验首款通用Agent产品Manus - 唯有惊叹。

他们用了一个非常有趣的交互形式，就是实时加进度同步。

一手体验首款通用Agent产品Manus - 唯有惊叹。

右边的界面就像PPT一样，不断的下一页下一页，让你实时的看到，当前这个Manus正在做什么，你能看到它的每一点想法，每一个动作，这个掌控感真的太强了。

即使要等很久，你看着他在一点一点执行，这个感觉也真的很爽。

而右下角的任务步骤也可以展开，非常直观的告诉你，大步骤进行到哪一个阶段了。

一手体验首款通用Agent产品Manus - 唯有惊叹。

交互做的极棒。

我这个case，只需要等大概几分钟以后，一个PPT就出来了。

一手体验首款通用Agent产品Manus - 唯有惊叹。

看看PPT。

一手体验首款通用Agent产品Manus - 唯有惊叹。

信息是没问题的，就是这美感= =还是欠缺了一点，但是在信息的排版和内容质量上，真的高到爆炸。

这个其实并不是特别能展示它的能力，我再展示另一个，我曾经试图让所有Agent尝试的例子，帮我整理发票。

我经常要出差，所以有一堆乱七八糟的发票需要让公司报销的，但是公司的大总管呢，制定了一个SOP，就是发票你不能直接打包给她，这样太乱，所以需要做成一个excel的模板，这样她好对账。

一手体验首款通用Agent产品Manus - 唯有惊叹。

就是这样的，但是你知道，我要每个月把我的十几张发票，都处理成表格，真的很麻烦。

所以，当我抱着试试看的态度，把这个任务交给Manus的时候，我震惊了。

因为，它成功了。。。

一手体验首款通用Agent产品Manus - 唯有惊叹。

我当时就浑身发麻了，实在太牛逼了。你们懂那种，浑身触电的感觉吗。

我给大家过一下流程。

最开始，我的Prompt超级简单。

一手体验首款通用Agent产品Manus - 唯有惊叹。

就这么简简单单的一句话。

他在思考完以后，处理成了8步任务。

一手体验首款通用Agent产品Manus - 唯有惊叹。

然后，解压压缩包，安装OCR依赖，提取发票，整理成表格等等等等。

一手体验首款通用Agent产品Manus - 唯有惊叹。

我什么也没干，他就自己这么跑着。

9分钟以后，提示我任务完成了。

我一回来，就看到了了这个画面。

一手体验首款通用Agent产品Manus - 唯有惊叹。

只有一个小地方没填上，其他都是对的。

太离谱了，这还需要人干吗？

我还用它，分析了一下阿里巴巴股票。

一手体验首款通用Agent产品Manus - 唯有惊叹。

同样的case，我们先看看OpenAI的DeepResearch的结果。

一手体验首款通用Agent产品Manus - 唯有惊叹。

质量是不错，很高，但是对比一下Manus，那可读性实在是有点不堪重负了。。。

Manus直接把任务拆解成了8步。

一手体验首款通用Agent产品Manus - 唯有惊叹。

最重要的是，当他们完成的时候，所输出的内容。

当我看到所谓的报告，给出的是一个链接的时候，我就猜到，这个事情有点不简单了。

一手体验首款通用Agent产品Manus - 唯有惊叹。

点进去以后，果然。。。

一手体验首款通用Agent产品Manus - 唯有惊叹。

不仅图文并茂，这尼玛，这些图标图表居然是可以交互的。。。

我真的给跪了，我想给Manus磕一个。

然后今天QwQ不是开源了32B的推理模型吗，我又让Manus随手做了一个千问开源的时间线。

在经历了30多分钟后，一张时间线的地图就出来了。大家可以验证一下看看准不准。。。

一手体验首款通用Agent产品Manus - 唯有惊叹。

我无话可说，人已跪地。

短短的几个小时的体验时间

人类真的即将，一败涂地。

在Manus的prompt技巧上，我自己试了下，你的点，一定要足够的清晰，描述越清晰具体，Manus 就能执行得越精准。

明确说明你的期望、格式要求和质量标准，可以大幅提升最终交付物的匹配度。

这一点，非常重要。

2025年3月6日，我觉得，即使在AI圈，也是一个值得铭记的日子。

阿里开源QwQ-32B，以如此尺寸在性能上追平DeepSeek R1满血版，另一边，Manus一夜崛起，把Agent工程带上了一个新的高度。

而这两个团队，都属于我们中国。

没错，都是中国团队。

为之自豪吧。

今夜的这一片星空，属于China。

宇宙，正在为我们而闪烁。

文章来自于“数字生命卡兹克”，作者“卡兹克”。

一手体验首款通用Agent产品Manus - 唯有惊叹。

关键词: AI , Manus , Agengt , 人工智能

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务，堪称「云端超级打工人」而且做到了开源界GAIA性能天花板，达到了57.7%，超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址：GitHub：https://github.com/camel-ai/owl

OpenManus

【开源免费】OpenManus 目前支持在你的电脑上完成很多任务，包括网页浏览，文件操作，写代码等。OpenManus 使用了传统的 ReAct 的模式，这样的优势是基于当前的状态进行决策，上下文和记忆方便管理，无需单独处理。需要注意，Manus 有使用 Plan 进行规划。
项目地址：https://github.com/mannaandpoem/OpenManus

AIExcel公式

【开源免费】smart-excel-ai是一个输入你想要的Excel公式的描述，即可帮你生成对应公式的AI项目
项目地址：https://github.com/weijunext/smart-excel-ai
在线使用：https://www.smartexcel.cc/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0