Scaling Law遭遇瓶颈，OpenAI被曝押注智能体“Operator”

7873点击 2024-11-14 21:14

继Anthropic之后，OpenAI也要接管人类电脑了？！

就在刚刚，彭博社爆料OpenAI将在明年1月推出Agent“Operator（操作员）”，为用户自动执行任务。

配方我们也很熟悉，只需在电脑上简单下达指令，Agent就能自动帮我们编码开发应用、订餐，做攻略等等。

好嘛，一看大家就明白，这是要和老对手Anthropic打起来了！

这将与Anthropic的computer use API进行竞争（Anthropic之前发布了computer use功能，号称接管人类电脑）

Scaling Law遭遇瓶颈，OpenAI被曝押注智能体“Operator”

事实上，在前一阵Reddit举办的有问必答活动上，CEO奥特曼曾信誓旦旦表示：

Agent将成为下一个重大突破。

同时，OpenAI首席产品官Kevin Weil进一步表示，让ChatGPT自主执行任务将是明年一大重点。

Scaling Law遭遇瓶颈，OpenAI被曝押注智能体“Operator”

不过，除了“遥遥领先”的Anthropic，OpenAI另一对手谷歌早已曝出将于12月发布自己的AI Agent版本。

国内百度智谱等模型厂商也推出了类似智能体和解决方案，甚至手机厂商荣耀、小米等还发布了自己的AI操作系统。

如此一来，压力也是来到了OpenAI这边。

虽说紧赶慢赶才有可能在明年1月推出，但还是有网友犀利吐槽太晚了！

Scaling Law遭遇瓶颈，OpenAI被曝押注智能体“Operator”

网友：1月太晚了

据彭博社消息，OpenAI计划于明年1月推出代号为“Operator”的智能体（Agent）。

其功能和10月份Anthropic发布的computer use类似，号称解放人类双手，代替用户操控电脑。

比如让它做旅游攻略，一段命令发布后，Agent就能自动打开谷歌搜索位置、天气，并结合用户的日程表给出切实可行的规划。

Scaling Law遭遇瓶颈，OpenAI被曝押注智能体“Operator”

另外，据OpenAI内部知情人士透露，在周三的员工会议上，有领导宣布：

届时该功能将以早期预览的形式发布（最初设计用于在网页浏览器中执行任务），且最初仅面向开发者提供API接口。

甚至根据爆料，OpenAI内部其实一直在同时推进很多Agent项目，而Operator可能是最接近成功的一个。

对于上述传闻，OpenAI截至发稿前并未有所回应。

不过，一直关注OpenAI动态的光头哥还是发现了Operator的踪迹。

Scaling Law遭遇瓶颈，OpenAI被曝押注智能体“Operator”

然而，即便消息属实，OpenAI的动作还是有点晚了~

毕竟环顾四周，一众竞争对手貌似都跑在前头：

最强劲敌Anthropic自不必说，人家早在10月份就推出了相关功能，一举惊艳AI圈。

而总是暗戳戳较劲的谷歌，也很有可能在12月推出代号为“Jarvis” （贾维斯）的Agent，按照双方时间表，这波谷歌没准获胜。

更不用说目前关系尴尬的微软，人家更是早Anthropic一天，一口气发布了10个Agent。

Scaling Law遭遇瓶颈，OpenAI被曝押注智能体“Operator”

抛开这些不谈，我们国内也有相当一部分选手开始在Agent上有所动作。

比如，百度在今年9月的百度云智大会就展示了Agent操作手机的一幕：

同样只需一段话，Agent就能帮我们制定行程，还能在不同APP间自行跳转。

制定一个国庆节去山西旅行3天的计划路线，要参考《黑神话：悟空》中涉及的山西经典，且希望住在品质好、性价比高的酒店，好评优先、500元以内，而且想要规划自驾路线。

Scaling Law遭遇瓶颈，OpenAI被曝押注智能体“Operator”

另外，就在Anthropic之后，智谱也发布了AutoGLM，让AI像人一样使用手机；而且还不像Claude需要打字提需求，AutoGLM实现了光靠嘴说来执行很多操作。

甚至，在AI PC和AI手机圈子里，各大玩家也是把眼光都聚焦到了这种新范式。

10月23日，华为发布荣耀MagicOS 9.0，定位为C端用户的“类人助理”，通过大模型底座打通app正式开启AI Agent阶段，实现系统级AI操作。

而且就在昨天，荣耀官方宣布， MagicOS 9.0首批产品开始公测，覆盖了荣耀Magic Vs3、V2系列、Magic6系列、Magic5系列。

另外，小米也发布了澎湃OS 2.0系统，搭载基于AI大模型重构的操作系统，将设备转化为智能的“个人助手”。

……

以上可以看出，一直作为领先者的OpenAI，在Agent方面已经开始落后于人了。

2025年，属于Agent

不过另一方面也说明，明年Agent大概率成为厮杀重点。

毕竟，大模型Scaling Law后继乏力已成热议焦点。

有消息称，OpenAI、谷歌、Anthropic都在推出更大、更强模型产品方面遭遇瓶颈。

具体来说，OpenAI代号“猎户座”（Orion）的下一代旗舰模型被曝提升不如预期，它相对GPT-4的提升幅度，小于GPT-4相对GPT-3，已进入收益递减阶段。

这也侧面和奥特曼的说法相印证，他表示可能不会把新模型命名为GPT-5。

另外，谷歌Gemini 2虽然计划很快发布，但也被曝性能提升也未达到DeepMind创始人的预期。

同时，面对网友一直呼唤的大杯Claude 3.5 Opus，Anthropic也悄悄从官网删除了相关描述。

而Agent，目前很明显已经成为大家新的方向。

这盛世或将如网友所愿：2025年，属于Agent！

Scaling Law遭遇瓶颈，OpenAI被曝押注智能体“Operator”

参考链接：

[1]https://www.bloomberg.com/news/articles/2024-11-13/openai-nears-launch-of-ai-agents-to-automate-tasks-for-users

[2]https://www.reddit.com/r/singularity/comments/1gqn099/openai_nears_launch_of_ai_agent_tool_to_automate/

[3]https://x.com/omarsar0/status/1856802883112767541

文章来自于“量子位”，作者“一水”。

Scaling Law遭遇瓶颈，OpenAI被曝押注智能体“Operator”

关键词: AI , openai , Operator , 智能体

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md