
AutoGLM 2.0 深度解析:云端智能体的技术跃进与现实挑战
AutoGLM 2.0 深度解析:云端智能体的技术跃进与现实挑战进入 2025 年,GUI Agent 赛道热度逐渐抬升 —— OpenAI 推出 Operator 并发布了 ChatGPT Agent,字节则发布了 UI-TARS-1.5 定位 GUI 开源方案。但大多数产品依然依赖本地执行,难以 24h 稳定运行。
进入 2025 年,GUI Agent 赛道热度逐渐抬升 —— OpenAI 推出 Operator 并发布了 ChatGPT Agent,字节则发布了 UI-TARS-1.5 定位 GUI 开源方案。但大多数产品依然依赖本地执行,难以 24h 稳定运行。
在正式走近ChatGPT Agent之前,让我们介绍一下这次谈话的几位主角,他们分别是OpenAI团队核心成员Isa Fulford、Casey Chu和孙之清。我们团队分别开发了Operator和Deep Research,在分析用户请求时发现,Deep Research的用户非常希望模型能够访问需要付费订阅的内容或有门槛的资源,而Operator恰好具备这种能力。
就在刚刚,OpenAI最新发布来了,ChatGPT Agent正式对外亮相。这是一个把“想”和“干”统一了的智能体,之前深度研究的思考和分析能力,Operator的操作执行能力,在ChatGPT Agent实现了统一。
2025年已成为名副其实的Agent元年。 不论是Operator、Manus、Genspark等爆款Agent的相继出现,还是各大厂商陆续发布MCP协议支持,种种迹象都在印证着AI Agent正经历从“玩具”到“工具”的关键转折。
自 Anthropic 推出 Claude Computer Use,打响电脑智能体(Computer Use Agent)的第一枪后,OpenAI 也相继推出 Operator,用强化学习(RL)算法把电脑智能体的能力推向新高,引发全球范围广泛关注。
2025年被称为agent元年,而OpenAI希望在这一年把agent做成自己的摇钱树。自主执行任务的Operator;二是可以辅助做深入研究,生成专业研究报告的Deep Research。
OpenAI首席财务官Sarah Friar探讨了通往AGI的发展路径,目前OpenAI已到达第三阶段:智能体(Agent)。除Operator和深度研究Deep Research智能体外,OpenAI即将发布全球最强编程智能体。
AI组队自主开发时代来临!OpenAI Operator和Replit Agent组队编程,仅在5个提示90分钟内完成了应用程序的开发。
实际上 Operator 只是最近一段时间,全球大模型公司智能体集中发布浪潮的一部分。早于 Operator 发布前两天,字节跳动豆包大模型团队就已经公布了同类型智能体:UI-TARS。
要花1450元才能玩到Operator,让本来满满期待的大伙,一下难受住了。而交了钱的各位,开始兴奋的晒出各种测试结果。有网友分享,Operator通过浏览网页在3分钟之内帮打找到了附近牙医诊所,回报了地址和电话。