ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
Scaling Law遭遇瓶颈,OpenAI被曝押注智能体“Operator”
5494点击    2024-11-14 21:14

继Anthropic之后,OpenAI也要接管人类电脑了?!


就在刚刚,彭博社爆料OpenAI将在明年1月推出Agent“Operator(操作员),为用户自动执行任务。



配方我们也很熟悉,只需在电脑上简单下达指令,Agent就能自动帮我们编码开发应用、订餐,做攻略等等。


好嘛,一看大家就明白,这是要和老对手Anthropic打起来了!


这将与Anthropic的computer use API进行竞争(Anthropic之前发布了computer use功能,号称接管人类电脑)



事实上,在前一阵Reddit举办的有问必答活动上,CEO奥特曼曾信誓旦旦表示:


Agent将成为下一个重大突破。


同时,OpenAI首席产品官Kevin Weil进一步表示,让ChatGPT自主执行任务将是明年一大重点。



不过,除了“遥遥领先”的Anthropic,OpenAI另一对手谷歌早已曝出将于12月发布自己的AI Agent版本。


国内百度智谱等模型厂商也推出了类似智能体和解决方案,甚至手机厂商荣耀、小米等还发布了自己的AI操作系统。


如此一来,压力也是来到了OpenAI这边。


虽说紧赶慢赶才有可能在明年1月推出,但还是有网友犀利吐槽太晚了!



网友:1月太晚了


据彭博社消息,OpenAI计划于明年1月推出代号为“Operator”的智能体(Agent)


其功能和10月份Anthropic发布的computer use类似,号称解放人类双手,代替用户操控电脑。


比如让它做旅游攻略,一段命令发布后,Agent就能自动打开谷歌搜索位置、天气,并结合用户的日程表给出切实可行的规划。



另外,据OpenAI内部知情人士透露,在周三的员工会议上,有领导宣布:


届时该功能将以早期预览的形式发布(最初设计用于在网页浏览器中执行任务),且最初仅面向开发者提供API接口


甚至根据爆料,OpenAI内部其实一直在同时推进很多Agent项目,而Operator可能是最接近成功的一个。


对于上述传闻,OpenAI截至发稿前并未有所回应。


不过,一直关注OpenAI动态的光头哥还是发现了Operator的踪迹。



然而,即便消息属实,OpenAI的动作还是有点晚了~


毕竟环顾四周,一众竞争对手貌似都跑在前头


最强劲敌Anthropic自不必说,人家早在10月份就推出了相关功能,一举惊艳AI圈。


而总是暗戳戳较劲的谷歌,也很有可能在12月推出代号为“Jarvis” (贾维斯)的Agent,按照双方时间表,这波谷歌没准获胜。


更不用说目前关系尴尬的微软,人家更是早Anthropic一天,一口气发布了10个Agent。



抛开这些不谈,我们国内也有相当一部分选手开始在Agent上有所动作。


比如,百度在今年9月的百度云智大会就展示了Agent操作手机的一幕:


同样只需一段话,Agent就能帮我们制定行程,还能在不同APP间自行跳转。


制定一个国庆节去山西旅行3天的计划路线,要参考《黑神话:悟空》中涉及的山西经典,且希望住在品质好、性价比高的酒店,好评优先、500元以内,而且想要规划自驾路线。



另外,就在Anthropic之后,智谱也发布了AutoGLM,让AI像人一样使用手机;而且还不像Claude需要打字提需求,AutoGLM实现了光靠嘴说来执行很多操作。


甚至,在AI PC和AI手机圈子里,各大玩家也是把眼光都聚焦到了这种新范式。


10月23日,华为发布荣耀MagicOS 9.0,定位为C端用户的“类人助理”,通过大模型底座打通app正式开启AI Agent阶段,实现系统级AI操作。


而且就在昨天,荣耀官方宣布, MagicOS 9.0首批产品开始公测,覆盖了荣耀Magic Vs3、V2系列、Magic6系列、Magic5系列。


另外,小米也发布了澎湃OS 2.0系统,搭载基于AI大模型重构的操作系统,将设备转化为智能的“个人助手”。


……


以上可以看出,一直作为领先者的OpenAI,在Agent方面已经开始落后于人了。


2025年,属于Agent


不过另一方面也说明,明年Agent大概率成为厮杀重点。


毕竟,大模型Scaling Law后继乏力已成热议焦点。


有消息称,OpenAI、谷歌、Anthropic都在推出更大、更强模型产品方面遭遇瓶颈


具体来说,OpenAI代号“猎户座”(Orion)的下一代旗舰模型被曝提升不如预期,它相对GPT-4的提升幅度,小于GPT-4相对GPT-3,已进入收益递减阶段。


这也侧面和奥特曼的说法相印证,他表示可能不会把新模型命名为GPT-5。


另外,谷歌Gemini 2虽然计划很快发布,但也被曝性能提升也未达到DeepMind创始人的预期。


同时,面对网友一直呼唤的大杯Claude 3.5 Opus,Anthropic也悄悄从官网删除了相关描述。


而Agent,目前很明显已经成为大家新的方向。


这盛世或将如网友所愿:2025年,属于Agent!



参考链接:

[1]https://www.bloomberg.com/news/articles/2024-11-13/openai-nears-launch-of-ai-agents-to-automate-tasks-for-users

[2]https://www.reddit.com/r/singularity/comments/1gqn099/openai_nears_launch_of_ai_agent_tool_to_automate/

[3]https://x.com/omarsar0/status/1856802883112767541


文章来自于“量子位”,作者“一水”。


关键词: AI , openai , Operator , 智能体
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md