国产模型，打平了Claude Fable 5！已上线OpenRouter

9898点击 2026-06-15 15:13

OpenRouter 上线了一个叫 Fusion 的新功能，把同一道题丢给一组模型，再让一个裁判模型把答案揉成一份。结果是，几个便宜的开源模型组起团来，能直接打平 Fable 5，价格只有其一半。

昨天，Anthropic 最强大的新模型 Claude Fable 5 遭全球禁用，OpenRouter 立刻上线了 Fusion 功能。

效果极其震撼——同时让几个高性价比的国产模型协作，即可达到 Fable 5 同样级别的智能，与此同时，价格连 Fable 5 的一半都不需要！

Harness 的艺术，让性价比的重要性有了根本性的改变——价格即智能。

单一模型不计成本的智能上限依旧重要，但现在绝不是唯一重要的事了。

高性价比的国产开源模型迎来第二春！

国产模型，打平了Claude Fable 5！已上线OpenRouter

https://x.com/OpenRouter/status/2065856853989270011

高性价比模型组团打赢了不计成本的单个前沿模型

测试用的是 Perplexity 出的 DRACO，专门考模型做深度研究的真功夫，覆盖学术、金融、法律、医疗等 10 个领域，每道题有约 39 条带权重的评分标准，答错会扣负分，靠堆字数糊弄拿不到分。

在这套标准下，OpenRouter 跑出三个发现。

第一，组团稳定压过单跑，融合配置在榜单上整体高于单模型。

第二，顶配组团能「超出前沿」，Fable 5 加 GPT-5.5 的 69.0% 就是天花板，比任何单个模型都高。

第三个最有意思，预算组（Gemini 3 Flash、Kimi K2.6、DeepSeek V4 Pro 三个模型组团）拿到 64.7%，干掉了单跑 60.0% 的 GPT-5.5 和 58.8% 的 Opus 4.8，逼到离 Fable 5 只差不到一个百分点，成本却只有前沿组团的一半。

国产模型，打平了Claude Fable 5！已上线OpenRouter

这里还藏着一个被 OpenRouter 老实交代出来的细节。

Fable 5 单跑那 65.3% 的成绩，其实只算了 93 道题，剩下 7 道被它自己的内容过滤器拦下了，没跑成。

OpenRouter 选择不拿 Opus 4.8 去补这 7 道，所以这个分是 Fable 真实能力的样子，但也说明它跟跑满 100 道的模型比，本来就占了点便宜。

把这件事和预算组的成绩摆在一起，革命性才显出来。

最强的那个单模型，恰恰也是最会拒绝你、最容易卡壳的那个。

过去用单模型，用户被一个模型的脾气、过滤器和盲区绑死，它罢工你就没辙。

Fusion 把这件事拆开了，一组模型里某一个掉链子，还有别人顶上，而且这组人可以全是高性价比模型，照样把活干到接近前沿的水准。

如何用上 Fusion

最简单的方式，在 API 调用里把模型名直接填成 openrouter/fusion，剩下的并行分发、裁判融合全在服务端跑完，一次调用就拿结果。

想让模型自己判断什么时候该组团，也可以把 Fusion 作为一个工具挂进 tools 列表，由模型自己决定要不要调用。

想自己挑队员的，可以在调用里指定参团的模型清单和负责融合的裁判模型，比如让一组国产模型参团、用一个更强模型坐镇做裁判。

不想碰代码的，直接打开 openrouter.ai/fusion 的网页版，选一个预设套餐或者手搭一个自己的 panel 就能试。

国产模型，打平了Claude Fable 5！已上线OpenRouter

https://openrouter.ai/fusion

裁判模型干的活儿比投票选优复杂。

它通读所有回答后产出一份结构化分析，列出哪些是共识、哪些互相矛盾、谁有独到见解、大家共同的盲区在哪，最后由作答模型基于这份分析重新写出成稿。

国产模型，打平了Claude Fable 5！已上线OpenRouter

真正变天的是性价比这件事

很多最复杂最困难的任务，模型智能是一道硬门槛，针对这类任务，再贵也得用最强的。

Fusion 把这个排序撬动了。

预算组那 64.7% 说明一件事，几个高性价比模型组起团来，智能水平能逼近单个最强的前沿模型，价钱却砍掉一半。

当低价能换来几乎一样高的智能，「单模型最强」这个指标的分量就被稀释了，性价比从次要变量挪到了主角位置。

这对开源模型是实打实的利好。

预算组里的 Kimi K2.6 和 DeepSeek V4 Pro，都是国产开源路线的代表。

它们单拎出来未必跑得过闭源前沿，可一组起团，差距就被补上了大半。

对走开源、走性价比路线的国内模型公司来说，Fusion 这类融合机制等于辟出一条新赛道，不必在「单模型刷榜」上和闭源巨头硬碰，靠组合也能交付接近前沿的结果。

开源模型可能要迎来第二春了。

AGI 格局被搅动

Fusion 还顺手验证了一个反直觉的发现。

OpenRouter 让 Opus 4.8 和自己组队，同一道题跑两遍再融合，分数从单跑的 58.8% 涨到 65.5%，足足多了 6.7 分。

国产模型，打平了Claude Fable 5！已上线OpenRouter

同一个模型跑两遍，会走出不同的推理路径、调用不同的工具、选取不同的资料，光是把这些差异融合起来，提升就已经很可观。

可见 Fusion 的增益有相当一部分来自「融合」这个动作本身。

顺着这个逻辑往大了想，过去几年行业默认的路是把单个模型堆到尽可能强，参数更大、训练更久、能力更前沿，仿佛通往 AGI 就是一条单模型不断变强的直线。

Fusion 给出了另一种可能，把多个视角各异的模型组织起来协作，产出的结果可以超过其中任何一个，就像一支多样化的人类团队能解决任何单个天才都搞不定的问题。

通往 AGI 甚至 ASI 的关键，有一部分藏在 Harness 里。

竞争的焦点会跟着挪位，谁能把一群参差不齐的模型调度好、融合好，可能和谁能训出最强的单个模型，变得同样重要。

参考资料：

https://openrouter.ai/blog/announcements/fusion-beats-frontier/

文章来自于"新智元"，作者 "马可"。

关键词: AI新闻 , OpenRouter , Fusion , Claude Fable 5平替方案

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址：https://github.com/InternLM/MindSearch
在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。
项目地址：https://github.com/miurla/morphic/tree/main
在线使用：https://www.morphic.sh/