下面这个,不是 Manus,是 OpenAI 新货:
凌晨 1 点的时候,OpenAI 发布了全套 Agent 开发套件,让手搓 Manus 触手可及。套件包含 4 个主要内容
不黑不吹:这次的发布,比 GPT 4.5 有诚意太多了,值得掌声。
在这篇文章里,我将结合发布会里的内容,以及「发布会中没说,但我知道的内容」,给大家带来最完整的呈现。
这是一个专门为 Agent 进行优化的 API,并支持以往 API (Chat Completions API )的所有功能。
这里需要小吹一下:Responses API 支持新的内置工具,并支持可预测性的流式事件,极大的简化了项目的复杂度。
可以看一下这个视频,感受下:
为了直观的展示能力,这里我做了个对比图:
对于原本的 Chat Completions API,未来虽不会下线,但一些新模型可能不再支持。
因此:如果没有历史包袱,开新坑的时候,无脑用新 API 就好了
从调用的角度,差异不大,稍微修改下就好了
你看到这篇文章,很可能是老板发过来的:让你整理下这东西的价值/特性。
我给整理好了,贴在这里。
这里说个八卦,在 23 年的时候,OpenAI 搞了个叫做 Assistants API,被建议用于 Agent 开发。
而那时,作为 OpenAI 的生态负责人的 Logan,也向外传递了这一消息。
但老实讲,这个 API 非常非常难用,甚至还要额外付费,就一直没啥人用,于是...
24年3月初的时候,Logan 突然离职(那段时间 OpenAI 风波不止)
自那之后,关于 Assistants API 的升级的事儿,就没后文了。
再然后就是今天 Response API 发布后,Assistants API 被预告了将在 2026 年下线。
果然,曾经的小甜甜,今天的牛夫人。
在这次的官方发布中,包含三种内置工具:
按官方计划,之后还会再加入「代码编译器」,等更新吧
这些东西,都需要前面提到的 Responses API,方式较为通用
from openai import OpenAI
client = OpenAI()
response = client.responses.create(
model: "适用模型", // computer-use-preview或gpt-4o等
tools: [{
type: "工具名称", // web_search_preview, file_search, computer_use_preview // 工具特定参数...
}],
truncation: "auto", // computer_use必需
input="What was a positive news story from today?"
// 其他参数...
)
print(response.output_text)
没错...现在 OpenAI 的 API 支持搜索了,允许你配置的东西还蛮多的,比如国家、城市、时区、搜索量。
要点我整理如下:
老实讲,虽在合理范围,但还是偏贵。作为对比,常规的搜索 API 官方价格如下:
这不算是新功能,之前就推出过,算是个版本更新。
使用流程大抵是:
同样的,我给做了一份要点可视化
它很像智谱的牛牛:《附内测地址:AI 开始接管物理世界》,让 AI 通过截图理解界面状态并执行交互操作,实现自动化任务。
我翻了下接口文档,发现这东西目前支持 9 种行为
这些行为,将会被 CUA 进行自动的组合和执行,达到操作电脑的效果
按 OpenAI 的说法,性能肯定是 Sota(遥遥领先) 的
对了,如果你想快速体验,可以直接 fork 这个项目
https://github.com/openai/openai-cua-sample-app
这次,必须得吹爆 OpenAI 了,他们开源了一个硬货:OpenAI Agent 框架。
Git 地址在这:
https://github.com/openai/openai-agents-python
这是一个支持 multi-agent 的框架,任何符合 OpenAI Chat Completions API 的模型都可以来用。
换句话说,DeepSeek 也能用 OpenAI 的这个框架。
这里放几个示例
pip install openai-agents
from agents import Agent, Runner
agent = Agent(name="Assistant", instructions="You are a helpful assistant")
result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)
# 输出: Code within the code,
# Functions calling themselves,
# Infinite loop's dance.
pip install openai-agents
from agents import Agent, Runner
import asyncio
spanish_agent = Agent(
name="Spanish agent",
instructions="You only speak Spanish.",
)
english_agent = Agent(
name="English agent",
instructions="You only speak English",
)
triage_agent = Agent(
name="Triage agent",
instructions="Handoff to the appropriate agent based on the language of the request.",
handoffs=[spanish_agent, english_agent],
)
asyncdefmain():
result = await Runner.run(triage_agent, input="Hola, ¿cómo estás?")
print(result.final_output)
# 输出: ¡Hola! Estoy bien, gracias por preguntar. ¿Y tú, cómo estás?
if __name__ == "__main__":
asyncio.run(main())
import asyncio
from agents import Agent, Runner, function_tool
@function_tool
defget_weather(city: str) -> str:
returnf"The weather in {city} is sunny."
agent = Agent(
name="Hello world",
instructions="You are a helpful agent.",
tools=[get_weather],
)
asyncdefmain():
result = await Runner.run(agent, input="What's the weather in Tokyo?")
print(result.final_output)
# 输出: The weather in Tokyo is sunny.
if __name__ == "__main__":
asyncio.run(main())
OpenAI 这次带来了两个监控工具,一个叫 Logs,一个叫 Traces
https://platform.openai.com/traces
对于请求,是会被归入 Logs 里;
如果是 Agent 调试,整个监控也会被归入 Trace,就像是这样;
你可以在这里找到文档:
https://openai.github.io/openai-agents-python/
但我相信..如果你和我一样,是 Colab 用户,那么在调试的过程中,可能会出现这个问题:
之后 OpenAI 的朋友提醒道:在载入 openai agents 之前,先设置环境变量就行了
(我认为这是 bug,hhhhhh)
(以及在我测试下,记录还有点小的 bug,也反馈了,等修好)
在发布会的最后,主持人说了这么一句:
2025 is going to be the year of Agent
2025,是 Agent 之年
那么,加油!你也可以站在聚光灯下!
文章来自微信公众号 “ 赛博禅心 ”,作者 金色传说大聪明
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。
项目地址:https://github.com/mannaandpoem/OpenManus
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI