国产模型,打平了Claude Fable 5!已上线OpenRouter

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
国产模型,打平了Claude Fable 5!已上线OpenRouter
8932点击    2026-06-15 15:13

OpenRouter 上线了一个叫 Fusion 的新功能,把同一道题丢给一组模型,再让一个裁判模型把答案揉成一份。结果是,几个便宜的开源模型组起团来,能直接打平 Fable 5,价格只有其一半。


昨天,Anthropic 最强大的新模型 Claude Fable 5 遭全球禁用,OpenRouter 立刻上线了 Fusion 功能。


效果极其震撼——同时让几个高性价比的国产模型协作,即可达到 Fable 5 同样级别的智能,与此同时,价格连 Fable 5 的一半都不需要!


Harness 的艺术,让性价比的重要性有了根本性的改变——价格即智能。


单一模型不计成本的智能上限依旧重要,但现在绝不是唯一重要的事了。


高性价比的国产开源模型迎来第二春!


国产模型,打平了Claude Fable 5!已上线OpenRouter

https://x.com/OpenRouter/status/2065856853989270011


高性价比模型组团打赢了不计成本的单个前沿模型


测试用的是 Perplexity 出的 DRACO,专门考模型做深度研究的真功夫,覆盖学术、金融、法律、医疗等 10 个领域,每道题有约 39 条带权重的评分标准,答错会扣负分,靠堆字数糊弄拿不到分。


在这套标准下,OpenRouter 跑出三个发现。


第一,组团稳定压过单跑,融合配置在榜单上整体高于单模型。


第二,顶配组团能「超出前沿」,Fable 5 加 GPT-5.5 的 69.0% 就是天花板,比任何单个模型都高。


第三个最有意思,预算组(Gemini 3 Flash、Kimi K2.6、DeepSeek V4 Pro 三个模型组团)拿到 64.7%,干掉了单跑 60.0% 的 GPT-5.5 和 58.8% 的 Opus 4.8,逼到离 Fable 5 只差不到一个百分点,成本却只有前沿组团的一半。


国产模型,打平了Claude Fable 5!已上线OpenRouter


这里还藏着一个被 OpenRouter 老实交代出来的细节。


Fable 5 单跑那 65.3% 的成绩,其实只算了 93 道题,剩下 7 道被它自己的内容过滤器拦下了,没跑成。


OpenRouter 选择不拿 Opus 4.8 去补这 7 道,所以这个分是 Fable 真实能力的样子,但也说明它跟跑满 100 道的模型比,本来就占了点便宜。


把这件事和预算组的成绩摆在一起,革命性才显出来。


最强的那个单模型,恰恰也是最会拒绝你、最容易卡壳的那个。


过去用单模型,用户被一个模型的脾气、过滤器和盲区绑死,它罢工你就没辙。


Fusion 把这件事拆开了,一组模型里某一个掉链子,还有别人顶上,而且这组人可以全是高性价比模型,照样把活干到接近前沿的水准。


如何用上 Fusion


最简单的方式,在 API 调用里把模型名直接填成 openrouter/fusion,剩下的并行分发、裁判融合全在服务端跑完,一次调用就拿结果。


想让模型自己判断什么时候该组团,也可以把 Fusion 作为一个工具挂进 tools 列表,由模型自己决定要不要调用。


想自己挑队员的,可以在调用里指定参团的模型清单和负责融合的裁判模型,比如让一组国产模型参团、用一个更强模型坐镇做裁判。


不想碰代码的,直接打开 openrouter.ai/fusion 的网页版,选一个预设套餐或者手搭一个自己的 panel 就能试。


国产模型,打平了Claude Fable 5!已上线OpenRouter

https://openrouter.ai/fusion


裁判模型干的活儿比投票选优复杂。


它通读所有回答后产出一份结构化分析,列出哪些是共识、哪些互相矛盾、谁有独到见解、大家共同的盲区在哪,最后由作答模型基于这份分析重新写出成稿。


国产模型,打平了Claude Fable 5!已上线OpenRouter


真正变天的是性价比这件事


很多最复杂最困难的任务,模型智能是一道硬门槛,针对这类任务,再贵也得用最强的。


Fusion 把这个排序撬动了。


预算组那 64.7% 说明一件事,几个高性价比模型组起团来,智能水平能逼近单个最强的前沿模型,价钱却砍掉一半。


当低价能换来几乎一样高的智能,「单模型最强」这个指标的分量就被稀释了,性价比从次要变量挪到了主角位置。


这对开源模型是实打实的利好。


预算组里的 Kimi K2.6 和 DeepSeek V4 Pro,都是国产开源路线的代表。


它们单拎出来未必跑得过闭源前沿,可一组起团,差距就被补上了大半。


对走开源、走性价比路线的国内模型公司来说,Fusion 这类融合机制等于辟出一条新赛道,不必在「单模型刷榜」上和闭源巨头硬碰,靠组合也能交付接近前沿的结果。


开源模型可能要迎来第二春了。


AGI 格局被搅动


Fusion 还顺手验证了一个反直觉的发现。


OpenRouter 让 Opus 4.8 和自己组队,同一道题跑两遍再融合,分数从单跑的 58.8% 涨到 65.5%,足足多了 6.7 分。


国产模型,打平了Claude Fable 5!已上线OpenRouter


同一个模型跑两遍,会走出不同的推理路径、调用不同的工具、选取不同的资料,光是把这些差异融合起来,提升就已经很可观。


可见 Fusion 的增益有相当一部分来自「融合」这个动作本身。


顺着这个逻辑往大了想,过去几年行业默认的路是把单个模型堆到尽可能强,参数更大、训练更久、能力更前沿,仿佛通往 AGI 就是一条单模型不断变强的直线。


Fusion 给出了另一种可能,把多个视角各异的模型组织起来协作,产出的结果可以超过其中任何一个,就像一支多样化的人类团队能解决任何单个天才都搞不定的问题。


通往 AGI 甚至 ASI 的关键,有一部分藏在 Harness 里。


竞争的焦点会跟着挪位,谁能把一群参差不齐的模型调度好、融合好,可能和谁能训出最强的单个模型,变得同样重要。


参考资料:

https://openrouter.ai/blog/announcements/fusion-beats-frontier/


文章来自于"新智元",作者 "马可"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/