Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”
5947点击    2024-11-14 21:14

继Anthropic之后,OpenAI也要接管人类电脑了?!


就在刚刚,彭博社爆料OpenAI将在明年1月推出Agent“Operator(操作员),为用户自动执行任务。


Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”


配方我们也很熟悉,只需在电脑上简单下达指令,Agent就能自动帮我们编码开发应用、订餐,做攻略等等。


好嘛,一看大家就明白,这是要和老对手Anthropic打起来了!


这将与Anthropic的computer use API进行竞争(Anthropic之前发布了computer use功能,号称接管人类电脑)


Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”


事实上,在前一阵Reddit举办的有问必答活动上,CEO奥特曼曾信誓旦旦表示:


Agent将成为下一个重大突破。


同时,OpenAI首席产品官Kevin Weil进一步表示,让ChatGPT自主执行任务将是明年一大重点。


Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”


不过,除了“遥遥领先”的Anthropic,OpenAI另一对手谷歌早已曝出将于12月发布自己的AI Agent版本。


国内百度智谱等模型厂商也推出了类似智能体和解决方案,甚至手机厂商荣耀、小米等还发布了自己的AI操作系统。


如此一来,压力也是来到了OpenAI这边。


虽说紧赶慢赶才有可能在明年1月推出,但还是有网友犀利吐槽太晚了!


Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”


网友:1月太晚了


据彭博社消息,OpenAI计划于明年1月推出代号为“Operator”的智能体(Agent)


其功能和10月份Anthropic发布的computer use类似,号称解放人类双手,代替用户操控电脑。


比如让它做旅游攻略,一段命令发布后,Agent就能自动打开谷歌搜索位置、天气,并结合用户的日程表给出切实可行的规划。


Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”


另外,据OpenAI内部知情人士透露,在周三的员工会议上,有领导宣布:


届时该功能将以早期预览的形式发布(最初设计用于在网页浏览器中执行任务),且最初仅面向开发者提供API接口


甚至根据爆料,OpenAI内部其实一直在同时推进很多Agent项目,而Operator可能是最接近成功的一个。


对于上述传闻,OpenAI截至发稿前并未有所回应。


不过,一直关注OpenAI动态的光头哥还是发现了Operator的踪迹。


Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”


然而,即便消息属实,OpenAI的动作还是有点晚了~


毕竟环顾四周,一众竞争对手貌似都跑在前头


最强劲敌Anthropic自不必说,人家早在10月份就推出了相关功能,一举惊艳AI圈。


而总是暗戳戳较劲的谷歌,也很有可能在12月推出代号为“Jarvis” (贾维斯)的Agent,按照双方时间表,这波谷歌没准获胜。


更不用说目前关系尴尬的微软,人家更是早Anthropic一天,一口气发布了10个Agent。


Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”


抛开这些不谈,我们国内也有相当一部分选手开始在Agent上有所动作。


比如,百度在今年9月的百度云智大会就展示了Agent操作手机的一幕:


同样只需一段话,Agent就能帮我们制定行程,还能在不同APP间自行跳转。


制定一个国庆节去山西旅行3天的计划路线,要参考《黑神话:悟空》中涉及的山西经典,且希望住在品质好、性价比高的酒店,好评优先、500元以内,而且想要规划自驾路线。


Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”

Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”


另外,就在Anthropic之后,智谱也发布了AutoGLM,让AI像人一样使用手机;而且还不像Claude需要打字提需求,AutoGLM实现了光靠嘴说来执行很多操作。


甚至,在AI PC和AI手机圈子里,各大玩家也是把眼光都聚焦到了这种新范式。


10月23日,华为发布荣耀MagicOS 9.0,定位为C端用户的“类人助理”,通过大模型底座打通app正式开启AI Agent阶段,实现系统级AI操作。


而且就在昨天,荣耀官方宣布, MagicOS 9.0首批产品开始公测,覆盖了荣耀Magic Vs3、V2系列、Magic6系列、Magic5系列。


另外,小米也发布了澎湃OS 2.0系统,搭载基于AI大模型重构的操作系统,将设备转化为智能的“个人助手”。


……


以上可以看出,一直作为领先者的OpenAI,在Agent方面已经开始落后于人了。


2025年,属于Agent


不过另一方面也说明,明年Agent大概率成为厮杀重点。


毕竟,大模型Scaling Law后继乏力已成热议焦点。


有消息称,OpenAI、谷歌、Anthropic都在推出更大、更强模型产品方面遭遇瓶颈


具体来说,OpenAI代号“猎户座”(Orion)的下一代旗舰模型被曝提升不如预期,它相对GPT-4的提升幅度,小于GPT-4相对GPT-3,已进入收益递减阶段。


这也侧面和奥特曼的说法相印证,他表示可能不会把新模型命名为GPT-5。


另外,谷歌Gemini 2虽然计划很快发布,但也被曝性能提升也未达到DeepMind创始人的预期。


同时,面对网友一直呼唤的大杯Claude 3.5 Opus,Anthropic也悄悄从官网删除了相关描述。


而Agent,目前很明显已经成为大家新的方向。


这盛世或将如网友所愿:2025年,属于Agent!


Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”


参考链接:

[1]https://www.bloomberg.com/news/articles/2024-11-13/openai-nears-launch-of-ai-agents-to-automate-tasks-for-users

[2]https://www.reddit.com/r/singularity/comments/1gqn099/openai_nears_launch_of_ai_agent_tool_to_automate/

[3]https://x.com/omarsar0/status/1856802883112767541


文章来自于“量子位”,作者“一水”。


Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”

关键词: AI , openai , Operator , 智能体
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md