最近两天,我们见证了 Manus 的破圈。
这是一个非常棒的工作,也非常感谢这个具有十足创造力的团队,我们所有人都为之兴奋!
但邀请码一码难求。这就不禁让我想到,是否能做一个开源版呢?
于是和同事吃完饭的时候一拍即合,回公司搓了三个小时,终于把这个 OpenManus 完成了!
01
OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等,欢迎大家使用这个项目和给它 Star,玩的开心!
🔗Github:
https://github.com/mannaandpoem/OpenManus
需要注意的是,Manus 是自己有个云端的电脑,并且使用了更加复杂的 Tools 和自己训练的模型,以及流程上做了更多设计和优化,而OpenManus 则直接让 Agent 操作你的电脑,给每个人观看 Agent 操控自己电脑的机会
02
接下来我会详细介绍一些技术细节:
OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。
我们目前也已初步加入了具有 Plan&ReAct 的功能,正在优化调试,大家也可以尝试更改 System Prompt 让 OpenManus 学会记录文档和 Todo List 的习惯!期待大家发现更多玩法。
OpenManus 主要依赖于几个工具:
1. PythonExecute:执行 Python 代码与电脑系统交互,可以进行文件操作、数据处理、自动化任务等;
2. FileSaver:保存文件到本地,例如 txt,python,html 等;
3. BrowserUseTool:打开,浏览和控制你的浏览器;
4. GoogleSearch:进行网络信息检索。
需要注意,Manus 有更好的工具和组合,OpenManus 仅提供了一个基础版本。
在 OpenManus 中,我们使用 Claude-3.5-Sonnet 或 Claude-3.7-Sonnet 执行效果最佳,这是一个 Single Agent 系统,你也可以更换为其它的模型。在 Manus 中,可能涉及了 Multi-Agent 系统和多个由团队自己进行过 Post Train 的模型。
以上,就是我们三个小时做完的一切,希望这个开源项目能给你们带来快乐(不过,当心 Agent 把你的电脑搞坏😈)。
03
实测一:搜索 Manus Agent 的信息和报道,生成一个 html 用来汇总和报告这个 Agent,你的 html 应该尽可能美观。
实测二:写一个 html 版本的贪吃蛇游戏。
最后,感谢 MetaGPT 社区的开源团队的共同努力:
梁新兵,向劲宇(特工鲸鱼),张佳钇,于兆洋,洪思睿。
BTW,后续 MGX 也即将开源,敬请期待!
文章来自微信公众号 “ 特工宇宙 ”,作者 特工宇宙
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。
项目地址:https://github.com/mannaandpoem/OpenManus
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0