一手体验首款通用Agent产品Manus - 唯有惊叹。

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
一手体验首款通用Agent产品Manus - 唯有惊叹。
4861点击    2025-03-06 12:08

昨天夜里,深夜惊雷。


一个新团队突然发了一个首款通用行的项目:Manus。演示在此,我人直接看麻了。


一手体验首款通用Agent产品Manus - 唯有惊叹。


看完我的第一感觉,卧槽,人类又要一败涂地了。


这尼玛,就是OpenAI的DeepResearch和Claude的Computer Use的究极集合体,甚至,他还能自己写代码,直接Coding Agent。


这特么是什么怪物啊。。。


我预想到这一天会来,只是没想到,来的如此之早。


Manus在GAIA的评分上,也非常的离谱。


一手体验首款通用Agent产品Manus - 唯有惊叹。


已经超越OpenAI的DeepResearch的了,成为GAIA评分第一。


可能很多人不知道GAIA是个啥,我简单说一下。


GAIA(General AI Assistants)是一个面向通用AI助手能力的基准评测体系,由 Meta AI(FAIR)、Hugging Face 等研究团队于 2023 年提出。


有一篇非常著名的论文:


一手体验首款通用Agent产品Manus - 唯有惊叹。


里面有466个精心设计的问题。


传统的测试一般都是数学(AIME)或者一些专业知识问答、编程等等,但是GAIA测试,里面很多都是概念简单,但是需要多步骤解决的实际问题。


其中分为三个级别,Lv.1、Lv.2、Lv.3,难度依次递增。


想通过GAIA的测试,一般需要网络检索能力、工具调用能力、编程能力、文件处理能力等等。


在23年的时候,人类一般能达到90%的成功率,而那时候的最强AI GPT4,在第一级才勉强达到15%。


再看这张图,你就知道,有多强了。。。


一手体验首款通用Agent产品Manus - 唯有惊叹。


说实话,我目前还愿意为ChatGPT每个月都氪200刀,主要就是o1 Pro和DeepResearch,这两玩意有一说一,在我做一些研究和需要强推理任务的时候,还是非常好用的。


而Manus这波,把DeepResearch干碎了,要知道,它之前已经是最强了。。。


Manus网址在此:https://manus.im


现在有个很难顶的问题是封测中,所以只有邀请码的用户才能体验到。


所以,我也动用了我的人脉,花了十分钟的时间,联系到了Manus团队的人,非常幸运的获得了邀请码。


一手体验首款通用Agent产品Manus - 唯有惊叹。


不过,即使是没有拿到邀请码的用户,也可以去他们官网,大概看一下他们的Use Case,每一个,都非常的有意思。


一手体验首款通用Agent产品Manus - 唯有惊叹。


而如果你有了邀请码,正常登录进去以后,就是一个大大的界面:


一手体验首款通用Agent产品Manus - 唯有惊叹。


虽然都是一个对话框,但是Manus的能力还不太一样,他不是那个你提出个问题,AI一会就会直接给你回答Chatbot。


而是当你提出问题之后,他会根据你的问题和要求,来拆解任务,进行极度复杂的任务规划和执行。


并且会在云端自动运行,你可以直接退出出去,等运行完了,会通知你。


比如之前的那篇GAIA的论文,我想把PDF变成一个能拿出去讲的PPT,我把这个要求提给Manus的时候。


他会先把我的需求拆解。


我是这么说的:


1. 我希望你写一段Python程序,用OCR把这篇论文的PDF信息提取出来。


2. 将PDF里面的信息总结成PPT大纲。


3. 按照小米发布会的风格,做一份给普通人科普用的PPT。


4. 给我PPT的下载文件。


他会开始花一点时间来理解。


一手体验首款通用Agent产品Manus - 唯有惊叹。


然后,在右边的窗口上,运行一个虚拟机,准备开始执行操作。


一手体验首款通用Agent产品Manus - 唯有惊叹。


在虚拟机开启之后,会第一时间,列一份To Do List。


一手体验首款通用Agent产品Manus - 唯有惊叹。


然后,就会开始执行第一个任务,安装python库。


完成的项目,会全部在右边的预览窗口打x。


一手体验首款通用Agent产品Manus - 唯有惊叹。


他们用了一个非常有趣的交互形式,就是实时加进度同步。


一手体验首款通用Agent产品Manus - 唯有惊叹。


右边的界面就像PPT一样,不断的下一页下一页,让你实时的看到,当前这个Manus正在做什么,你能看到它的每一点想法,每一个动作,这个掌控感真的太强了。


即使要等很久,你看着他在一点一点执行,这个感觉也真的很爽。


而右下角的任务步骤也可以展开,非常直观的告诉你,大步骤进行到哪一个阶段了。


一手体验首款通用Agent产品Manus - 唯有惊叹。


交互做的极棒。


我这个case,只需要等大概几分钟以后,一个PPT就出来了。


一手体验首款通用Agent产品Manus - 唯有惊叹。


看看PPT。


一手体验首款通用Agent产品Manus - 唯有惊叹。


信息是没问题的,就是这美感= =还是欠缺了一点,但是在信息的排版和内容质量上,真的高到爆炸。


这个其实并不是特别能展示它的能力,我再展示另一个,我曾经试图让所有Agent尝试的例子,帮我整理发票。


我经常要出差,所以有一堆乱七八糟的发票需要让公司报销的,但是公司的大总管呢,制定了一个SOP,就是发票你不能直接打包给她,这样太乱,所以需要做成一个excel的模板,这样她好对账。


一手体验首款通用Agent产品Manus - 唯有惊叹。


就是这样的,但是你知道,我要每个月把我的十几张发票,都处理成表格,真的很麻烦。


所以,当我抱着试试看的态度,把这个任务交给Manus的时候,我震惊了。


因为,它成功了。。。


一手体验首款通用Agent产品Manus - 唯有惊叹。


我当时就浑身发麻了,实在太牛逼了。你们懂那种,浑身触电的感觉吗。


我给大家过一下流程。


最开始,我的Prompt超级简单。


一手体验首款通用Agent产品Manus - 唯有惊叹。


就这么简简单单的一句话。


他在思考完以后,处理成了8步任务。


一手体验首款通用Agent产品Manus - 唯有惊叹。


然后,解压压缩包,安装OCR依赖,提取发票,整理成表格等等等等。


一手体验首款通用Agent产品Manus - 唯有惊叹。


我什么也没干,他就自己这么跑着。


9分钟以后,提示我任务完成了。


我一回来,就看到了了这个画面。


一手体验首款通用Agent产品Manus - 唯有惊叹。


只有一个小地方没填上,其他都是对的。


太离谱了,这还需要人干吗?


我还用它,分析了一下阿里巴巴股票。


一手体验首款通用Agent产品Manus - 唯有惊叹。


同样的case,我们先看看OpenAI的DeepResearch的结果。


一手体验首款通用Agent产品Manus - 唯有惊叹。


质量是不错,很高,但是对比一下Manus,那可读性实在是有点不堪重负了。。。


Manus直接把任务拆解成了8步。


一手体验首款通用Agent产品Manus - 唯有惊叹。


最重要的是,当他们完成的时候,所输出的内容。


当我看到所谓的报告,给出的是一个链接的时候,我就猜到,这个事情有点不简单了。


一手体验首款通用Agent产品Manus - 唯有惊叹。


点进去以后,果然。。。


一手体验首款通用Agent产品Manus - 唯有惊叹。


不仅图文并茂,这尼玛,这些图标图表居然是可以交互的。。。


我真的给跪了,我想给Manus磕一个。


然后今天QwQ不是开源了32B的推理模型吗,我又让Manus随手做了一个千问开源的时间线。


在经历了30多分钟后,一张时间线的地图就出来了。大家可以验证一下看看准不准。。。


一手体验首款通用Agent产品Manus - 唯有惊叹。


我无话可说,人已跪地。


短短的几个小时的体验时间


人类真的即将,一败涂地。


在Manus的prompt技巧上,我自己试了下,你的点,一定要足够的清晰,描述越清晰具体,Manus 就能执行得越精准。


明确说明你的期望、格式要求和质量标准,可以大幅提升最终交付物的匹配度。


这一点,非常重要。


2025年3月6日,我觉得,即使在AI圈,也是一个值得铭记的日子。


阿里开源QwQ-32B,以如此尺寸在性能上追平DeepSeek R1满血版,另一边,Manus一夜崛起,把Agent工程带上了一个新的高度。


而这两个团队,都属于我们中国。


没错,都是中国团队。


为之自豪吧。


今夜的这一片星空,属于China。


宇宙,正在为我们而闪烁。


文章来自于“数字生命卡兹克”,作者“卡兹克”。


一手体验首款通用Agent产品Manus - 唯有惊叹。

关键词: AI , Manus , Agengt , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
OpenManus

【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。

项目地址:https://github.com/mannaandpoem/OpenManus


3
AIExcel公式

【开源免费】smart-excel-ai是一个输入你想要的Excel公式的描述,即可帮你生成对应公式的AI项目

项目地址:https://github.com/weijunext/smart-excel-ai

在线使用:https://www.smartexcel.cc/(付费)

4
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

5
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0