想了想,应该有不少读者想看我对 Manus 的评价,还是不偷懒,分享直播实测 8 小时的真实感受。
先给总体评价(非常希望你们能看到最后的小结):
整体感受下来,Manus 工程、产品化做得都很棒,易上手、价值感知明确。
所以文章开头必须给 Manus 团队点赞,同时做到“想到”、“做出来”、“做到让人愿意好好用用的程度”,这真的很不容易。
本文不聊太深入的技术原理,就想给用过 or 没用过的读者,通俗易懂地讲讲 Manus 能做什么,缺点什么,意味着什么。
Manus 团队自己说过:“他们也不知道这个产品的能力边界在哪”。我也十分好奇这个问题,于是设计了 6 个最想测的任务。
按照顺序,是以下这些(➡️ 可以通过链接查看详细回放):
1. 创作世界首支 AI 自主创作的自我介绍的视频:https://manus.im/share/EWwJDzTWrW8MjqThadvTT9?replay=1
2. 帮我草拟邮件,找到 Manus 官方邮箱,完成 Manus 邀请码的申请:https://manus.im/share/Fk6f4LCKvuM0lQ62EJf6SZ?replay=1
3. 自主玩 2048 网页游戏,并给自己解说,写游戏心得:https://manus.im/share/5XJGL0FQP1nuWchxtqsV8R?replay=1
4. 安装《宝可梦:黑》,并尝试捕获第一只宝可梦:https://manus.im/share/pCPVNmrejPknbTy5GBuzAy?replay=1
5. 自行进入可灵 AI ,创作一条由 AI 操作生成的 AI 视频:https://manus.im/share/Q08zzgKnAPIog5QxqMqHoA?replay=1
6. 让 Manus 自行调查自己所处的环境,输出 Manus 自己的技术架构:https://manus.im/share/Gez1G14tfRexf50GMZyckD?replay=1
1. 它真的创作视频了,用 opencv 一帧帧画的,但有点丑,也不能自己配上音。但毕竟做出视频了(也有其他朋友有测出配上 BGM 的)
2. 能帮我草拟邮件,但是还不支持使用邮件服务代发邮件,可能官方有限制
3. 真的玩起来了,超出预期!最高分 192 分,比起人类是差很多(理论上存在 10w 分以上的可能),每一步也很慢,但终究是模拟键鼠输入玩起来了。看来 Manus 能玩一切非即时性游戏。由于单个 case 的上下文长度现在有限制,我正在向官方申请解除限制,看看无限制情况下,Manus 到底能玩到多少分
4. 这个 case 很神奇,我也没看懂它到底做到了什么程度,希望大家都来尝试分析一下:
但你最好自己试试再下判断。因为每个人在不同的任务场景,预期都不一样。
实际上有好多我不熟悉的任务中,它做的比我快多了,也好多了。
所以我也在问自己一个问题:现阶段的 manus,我能找到长期用它的主力场景吗?
我现在暂时没想出答案,我直觉是我自己的问题,我们都应该再多试试,思考自己与 AI 的最佳人机协作模式。
虽然很多人说 Manus 用的这些技术并无壁垒,甚至有些部分都是半年前被验证的项目。
但这不阻碍 Manus 是目前唯一一个把 AI、工程化、产品化结合的如此棒的产品。
一个产品,同时做到“想到”、“做出来”、“做到让人愿意好好用用的程度”,这真的很不容易。
它打通了几乎全部的链路,以极低的体验成本(国内可用、免费试用,有邀请码限制,但正在每天数千人的速度逐步放开),让人类能够一站式地托管完成复杂的任务。
未来胜出的可能并不是拥有最强技术的公司,而是那些真正理解了AI与人类如何共进化、并能建立持续、稳定的协作机制的公司。(出自:https://yage.ai/manus.html)
在 Manus 眼见为实的体感刺激下,广大从业者、一般用户,都进一步开始思考:我们的产品在 AI 时代,到底应该是什么样的?未来的人机协作是怎么样的?人应该与 AI 如何协作共处?
行文至此,作为行业首个爆火的通用 Agent(且尚在 alpha 内测阶段),Manus 与其团队已经承担了极大的关注度与舆论压力。
在思考本文标题的时候,我其实犹豫了很久,要不要拔高到如此程度。
虽然没有任何利益关系,最终还是选择了你们现在看到的版本。
因为他们值得:
——Manus 以极高的产品完成度,再次把隔在人和 agent 的未来的迷雾吹散了一些,透出了更多光亮。
文章来自于“一泽Eze”,作者“一泽Eze”。
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。
项目地址:https://github.com/mannaandpoem/OpenManus
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales