Anthropic重磅更新 Advisor Strategy 上线!最强Opus做大脑,Sonnet疯狂搬砖

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Anthropic重磅更新 Advisor Strategy 上线!最强Opus做大脑,Sonnet疯狂搬砖
8260点击    2026-04-10 16:16

深夜,Anthropic官宣重磅更新:Claude「顾问策略」(Advisor Strategy)上线


这一架构的核心逻辑是——


让智商最高的Opus 4.6退居幕后当「顾问」; 


让性价比极高的Sonnet 4.6或Haiku 4.5冲在前面当「执行者」。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


简单来说,Opus做「大脑」,Sonnet/Haiku做「手脚」


在全新的工作流中,核心是由Sonnet/Haiku,全权负责跑通整个流程。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


当遇到真正棘手的难题、无法做出合理决策时,才会通过API调用Opus「顾问」来指点迷津。


随后,Opus会迅速审阅上下文,给出一个锦囊妙计、修正方案,然后由执行者继续完成剩下的「苦差事」。


这一策略的提出,真正反转了传统的「大模型拆解任务、小模型搬砖」模式。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


结果,实测数据极其震撼。


在SWE-bench编程测试中,「Sonnet 4.6+Opus 4.6」得分提升2.7个百分点,而成本暴降11.9%


更离谱的是,「Haiku4.5+Opus 4.6」性能直接翻倍,成本($1.07)只有Sonnet($7)的一小部分。


用网友的话来说,「享受Opus的性能,却无需支付Opus的钱」


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


还有人全网奔走相告,Claude「龙虾」超进化了,一个更好的OpenClaw版本诞生。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


可以说,这不只是一次API更新,更是一场彻底的效率革命。


Claude有了「顾问」


最强Opus 4.6幕后指路


一直以来,开发者在构建AI Agent的过程中,往往面临一个两难选择:


  • 用顶级模型虽聪明,但价格昂贵;
  • 用轻量模型虽便宜,但处理复杂任务时容易「掉链子」。


传统模式的做法是,让性能最强的LLM坐镇中央当「编排者」,把大任务拆解成若干子任务,再分发给更小、更快的模型去执行。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


这就好比一个项目经理(大模型)在开会,给底下的组员(小模型)分发不同的工单。


它的局限在于,无论任务简单还是复杂,顶级模型都必须首先介入拆解。每一条请求的开头,都要烧掉最贵的Token。


Anthropic这次玩了个「反直觉」的战术,彻底反转了「大管小」的逻辑。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


「顾问策略」采用了一种更加灵活的向上追溯机制:


  • 执行者: 由Sonnet 4.6或Haiku 4.5担任,负责端到端的任务执行、调用工具、读取结果并持续迭代;
  • 顾问: 由顶级模型Opus 4.6担任,潜伏在幕后,并不直接与人对话,也不调用工具。


只有当「执行者」遇到无法独立决策的难题时,它才会主动向「顾问」请教。


Opus会读取共享的上下文,给出计划、纠正方案或停止信号,随后「执行者」再带着这些「应急妙策」继续工作。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


这种策略,将前沿级的推理能力精准地用在了「刀刃」上。


在SWE-bench测试中,「Sonnet+Opus顾问」提升了2.7个百分点,还将单次Agent任务的成本压缩了11.9%。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


在智能体基准测试中:


  • 智能体搜索任务(BrowseComp),性能涨2.3%,成本6.13美元。
  • 终端编码任务(Terminal-Bench 2.0),性能涨3.8%,成本0.88美元。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


对于预算更敏感的场景,「Haiku 4.5+Opus 4.6顾问」的组合表现更是令人惊艳。


在BrowseComp测试中,其得分从19.7%飙升至41.2%,性能翻倍。


虽然这比Sonnet单独运行的得分低29%,但其成本却降低了85%,是处理高并发任务的极佳方案。


在Terminal-Bench 2.0中,性能暴涨13.3%,成本也降低了0.2美元。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


对于那些既需要一定智能水平、又需要控制成本的大规模批量任务来说,Haiku绝对是个绝佳的选择。


官博中,Anthropic说的非常直白——


这能让AI Agent拥有接Opus级别的智能,同时让token开销保持在接近Sonnet的水平。


不得不说,简直太香了!


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


一行代码,即可调用


那么,究竟如何上手?


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


目前,Claude平台上已上线了「测试版」。


只需在API调用中改写「一行代码」,便能用上「顾问策略」,具体来说:


在Messages API请求中声明advisor_20260301,模型的交接就会在单次/v1/messages请求的内部静默完成——不需要额外去回传数据或管理上下文。


「执行者」模型会自己决定什么时候摇人。


当它发起调用时,会把整理好的上下文路由给「顾问」模型,拿到计划后返回,「执行者」接着干活,所有操作都在同一个请求里一气呵成。


response = client.messages.create(
    model="claude-sonnet-4-6",  # 执行者
    tools=[
        {
"type": "advisor_20260301",
"name": "advisor",
"model": "claude-opus-4-6",
"max_uses": 3,
        },
# ... 你的其他工具
    ],
    messages=[...]
)
# 顾问消耗的Token会在用量(usage)中单独列出。


那么,token消耗的这笔账如何算?


「顾问」消耗的Token按Opus定价,执行者消耗的Token按Sonnet或Haiku定价。


关键在于,顾问每次出手只生成一份简短的计划,通常在400到700个Token左右。


而真正的大头输出,全部由执行者以更低的费率包揽。


整体算下来,成本远低于从头到尾只用Opus。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


担心顾问被「薅」太多次?Anthropic也想到了。


开发者可以通过设置max_uses,限制单次请求中顾问的最大调用次数。


同时,顾问的Token消耗会在用量信息中单独列出,方便追踪每一层模型的开销。


而且,advisor工具跟你现有的工具栈完全兼容。


它就是Messages API请求里的一个普通条目,没有任何特殊架构要求。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


你的Agent可以在同一个循环里,一边搜索网页、执行代码,一边向Opus请教。


该搬砖搬砖,该问策问策,互不干扰。


一些用上「顾问策略」的大客户全都被瞬间惊艳了,EVE机器学习工程师直言——


用上Haiku 4.5+Opus 4.6,成本降低了1/5,还用上了接近Opus级别的智能。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


Agent不用一直转了


后台脚本守着就行


同在今天,Anthropic为Claude带来了名为——Monitor的重量级工具更新。


这一功能,直接让Claude创建并运行「后台脚本」。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


过去,让Agent监控某个任务(比如等CI跑完、等PR审批),它必须不停循环询问,每问一次就烧一轮Token。


Monitor让Claude自己写一段后台监控代码。程序报错了,唤醒。代码合规检查通过了,唤醒。


从「主动轮询」变成「事件驱动」。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


有了Monitor,Claude可以做到两件事。


  • 持续盯着系统日志中的错误,有问题了才叫Agent过来处理。
  • 自动追踪GitHub上的PR状态,脚本在后台轮询,Agent本身不消耗Token。


具体用的时候,需在提示词中明确要求,如Anthropic研究员给出的例子所示。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


和Advisor Strategy的逻辑一脉相承,都是在Agent运行中找到「不需要烧钱的环节」,然后把它剥离出去。


一个省模型调用的钱,一个省空转循环的钱。


但顾问策略和Monitor不是孤立的两招。


再加上此前刚发布的Managed Agents,Agent的运维和基建全由Anthropic包办,0.08美元一小时。


这几步棋放在一起看,方向就明了了。


Anthropic不再只是一家卖模型API的公司。它在搭一整套Agent运行时平台,从模型调度到任务执行到云端托管,全栈通吃。


你不需要自己养Agent了


Advisor Strategy和Monitor优化的是Agent的「跑法」,Managed Agents解决的是更根本的问题,谁来管基建。


0.08美元一个session小时,沙箱隔离、断线自动恢复、会话可自主跑数小时,Anthropic全包了。


Managed Agents管运行,MCP Connectors管工具接入。


Anthropic的Connectors Directory覆盖Asana、Notion、Sentry等工具,标准OAuth一键接入。


另一边,4月4日封杀了OpenClaw通过Claude订阅额度调API的通道,用户要么换后端,要么按量付费,成本翻倍。


推自家生态,切竞品供给,一套组合拳。


HN上有人总结,「核心不是封杀谁,是让开发者习惯在Anthropic的平台上跑Agent。」


从卖模型到卖运行时


Advisor Strategy管调度,Monitor管效率,Managed Agents管基建,MCP Connectors管生态。四层叠起来,一个完整的Agent平台。


Anthropic不是在卖聊天机器人,是在卖「你只管说要做什么,剩下的我来」。


而且野心可能不止于软件。据Reuters本周报道,Anthropic正在探索自研AI芯片,目前仍处于早期阶段。


支撑这个野心的数字,年化营收突破300亿美元,去年底还是90亿。企业级AI收入对OpenAI的份额已经追到50:50。


这盘棋能不能赢,取决于开发者愿不愿意把Agent逻辑交给Anthropic的平台。


Sentry、Notion、Rakuten已经投了票。


彩蛋


Claude到底有多大?这是AI圈最想拆解的黑盒。


马斯克在对比自家Grok 4.2与Claude时,漫不经心地透露了一个数字——


Claude Sonnet参数量约为1T,Opus高达5T。


对此,有大佬猜测,Claude Mythos体量至少是10T,甚至更大级别。


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


一行代码,Claude养虾成本降85%!最强Opus做大脑,Sonnet疯狂搬砖


参考资料:


https://x.com/claudeai/status/2042308622181339453?s=20  


https://x.com/noahzweben/status/2042332268450963774?s=20


文章来自于微信公众号 "新智元",作者 "新智元"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0