联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)
7887点击    2025-03-12 08:32

下面这个,不是 Manus,是 OpenAI 新货:


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


凌晨 1 点的时候,OpenAI 发布了全套 Agent 开发套件,让手搓 Manus 触手可及。套件包含 4 个主要内容


  • Responses API:本次发布会的核心,可视作 Chat API 的上位升级
  • 内置工具 (Built-in Tools),有三个: 网页搜索、文件搜索 和 Computer Using Agent(CUA)
  • Agents SDK:这是个开源 Agent 框架(你没看错,OpenAI Open 了),让开发者能够更轻松地构建和管理复杂的单 Agent 和多 Agent 系统。
  • 监控工具:在开发者后台,帮助追踪和检查 Agent 工作流的执行过程。


不黑不吹:这次的发布,比 GPT 4.5 有诚意太多了,值得掌声


在这篇文章里,我将结合发布会里的内容,以及「发布会中没说,但我知道的内容」,给大家带来最完整的呈现。


先说 Responses API


这是一个专门为 Agent 进行优化的 API,并支持以往 API (Chat Completions API )的所有功能。


这里需要小吹一下:Responses API 支持新的内置工具,并支持可预测性的流式事件,极大的简化了项目的复杂度


可以看一下这个视频,感受下:


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


为了直观的展示能力,这里我做了个对比图:


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


对于原本的 Chat Completions API,未来虽不会下线,但一些新模型可能不再支持。


因此:如果没有历史包袱,开新坑的时候,无脑用新 API 就好了


从调用的角度,差异不大,稍微修改下就好了


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


你看到这篇文章,很可能是老板发过来的:让你整理下这东西的价值/特性。


我给整理好了,贴在这里。


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


这里说个八卦,在 23 年的时候,OpenAI 搞了个叫做 Assistants API,被建议用于 Agent 开发。


而那时,作为 OpenAI 的生态负责人的 Logan,也向外传递了这一消息。


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


但老实讲,这个 API 非常非常难用,甚至还要额外付费,就一直没啥人用,于是...


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


24年3月初的时候,Logan 突然离职(那段时间 OpenAI 风波不止)


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


自那之后,关于 Assistants API 的升级的事儿,就没后文了。


再然后就是今天 Response API 发布后,Assistants API 被预告了将在 2026 年下线。


果然,曾经的小甜甜,今天的牛夫人。


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)



Built-in Tools


在这次的官方发布中,包含三种内置工具:


  • Web Search / 网页搜索
  • File Search / 文件搜索
  • Computer Use Agent(CUA)工具流程图


按官方计划,之后还会再加入「代码编译器」,等更新吧


这些东西,都需要前面提到的 Responses API,方式较为通用


from openai import OpenAI
client = OpenAI()

response = client.responses.create(
model: "适用模型", // computer-use-preview或gpt-4o等
tools: [{
type: "工具名称", // web_search_preview, file_search, computer_use_preview // 工具特定参数...
}],
truncation: "auto", // computer_use必需
input="What was a positive news story from today?"
// 其他参数...
)

print(response.output_text)


Web Search / 网页搜索


没错...现在 OpenAI 的 API 支持搜索了,允许你配置的东西还蛮多的,比如国家、城市、时区、搜索量。


要点我整理如下:


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


老实讲,虽在合理范围,但还是偏贵。作为对比,常规的搜索 API 官方价格如下:


  • Google Search:$5/1000 次(每天限制 1 万次)
  • Bing Search:$20/1000 次


File Search / 文件搜索


这不算是新功能,之前就推出过,算是个版本更新。


使用流程大抵是:


  • 上传文件到 OpenAI 的向量库
  • 它会处理一阵子,完了就可以使用了
  • 使用 file_search 来获取回答


同样的,我给做了一份要点可视化


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


Computer Use Agent(CUA)


它很像智谱的牛牛:《附内测地址:AI 开始接管物理世界》,让 AI 通过截图理解界面状态并执行交互操作,实现自动化任务。


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


我翻了下接口文档,发现这东西目前支持 9 种行为


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


这些行为,将会被 CUA 进行自动的组合和执行,达到操作电脑的效果


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


按 OpenAI 的说法,性能肯定是 Sota(遥遥领先) 的


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


对了,如果你想快速体验,可以直接 fork 这个项目


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


https://github.com/openai/openai-cua-sample-app


Agents SDK


这次,必须得吹爆 OpenAI 了,他们开源了一个硬货:OpenAI Agent 框架。


Git 地址在这:


https://github.com/openai/openai-agents-python


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


这是一个支持 multi-agent 的框架,任何符合 OpenAI Chat Completions API 的模型都可以来用。


换句话说,DeepSeek 也能用 OpenAI 的这个框架


这里放几个示例


基础示例


pip install openai-agents
from agents import Agent, Runner

agent = Agent(name="Assistant", instructions="You are a helpful assistant")

result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)
# 输出: Code within the code,
# Functions calling themselves,
# Infinite loop's dance.



代理交接


pip install openai-agents
from agents import Agent, Runner
import asyncio

spanish_agent = Agent(
name="Spanish agent",
instructions="You only speak Spanish.",
)

english_agent = Agent(
name="English agent",
instructions="You only speak English",
)

triage_agent = Agent(
name="Triage agent",
instructions="Handoff to the appropriate agent based on the language of the request.",
handoffs=[spanish_agent, english_agent],
)

asyncdefmain():
result = await Runner.run(triage_agent, input="Hola, ¿cómo estás?")
print(result.final_output)
# 输出: ¡Hola! Estoy bien, gracias por preguntar. ¿Y tú, cómo estás?

if __name__ == "__main__":
asyncio.run(main())


函数工具


import asyncio
from agents import Agent, Runner, function_tool

@function_tool
defget_weather(city: str) -> str:
returnf"The weather in {city} is sunny."

agent = Agent(
name="Hello world",
instructions="You are a helpful agent.",
tools=[get_weather],
)

asyncdefmain():
result = await Runner.run(agent, input="What's the weather in Tokyo?")
print(result.final_output)
# 输出: The weather in Tokyo is sunny.

if __name__ == "__main__":
asyncio.run(main())


监控工具


OpenAI 这次带来了两个监控工具,一个叫 Logs,一个叫 Traces


https://platform.openai.com/traces


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


对于请求,是会被归入 Logs 里;


如果是 Agent 调试,整个监控也会被归入 Trace,就像是这样;


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


你可以在这里找到文档:

https://openai.github.io/openai-agents-python/


但我相信..如果你和我一样,是 Colab 用户,那么在调试的过程中,可能会出现这个问题:


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


之后 OpenAI 的朋友提醒道:在载入 openai agents 之前,先设置环境变量就行了


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)


(我认为这是 bug,hhhhhh)

(以及在我测试下,记录还有点小的 bug,也反馈了,等修好)


最后


在发布会的最后,主持人说了这么一句:


2025 is going to be the year of Agent


2025,是 Agent 之年


那么,加油!你也可以站在聚光灯下!



文章来自微信公众号 “ 赛博禅心 ”,作者 金色传说大聪明


联网/用电脑... OpenAI 新 Agent 套件全解析(另附:发布会没说的 30+ 要点)

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
OpenManus

【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。

项目地址:https://github.com/mannaandpoem/OpenManus


3
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

4
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

5
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

6
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI