占领OpenRouter调用量榜单第一的神秘模型Hunter Alpha,终于揭开神秘面纱——
既不是GPT,也不是DeepSeek,而是来自小米的万亿旗舰模型MiMo-V2-Pro。
就在今天凌晨,小米团队官宣了MiMo-V2家族三款新模型,分别是Pro、Omni和TTS。

其中对于Pro,小米在官方介绍中明确提到,就是此前的Hunter Alpha。

在这之前,网友们对这两款模型的身份可谓是猜什么的都有,有的说是GPT,也有人觉得是DeepSeek。
当知道它的真实身份是小米的时候,很多人都为之惊讶。

MiMo-V2-Pro参数规模万亿,支持百万级长文本,非常擅长应对真实场景中的任务。
它不仅在Artificial Analysis全球智能指数里拿了全球第八和国内第二的好成绩,写代码的本事也超过了Claude 4.6 Sonnet。
无论是调用工具还是规划复杂任务,它的表现也都相当扎实,能直接用Three.js写出一个带有动态背景和升级路线的3D塔防游戏代码。

当然,一同亮相的Omni和语音合成模型TTS,也同样实力强悍。

作为整个家族的旗舰大模型,MiMo-V2-Pro核心设计围绕真实世界的智能体工作流展开。
它的模型总参数量突破了1T大关,激活参数达到42B,上下文窗口1M,整体规模大约是MiMo-V2-Flash的三倍。
在底层架构设计上,它继承了混合注意力机制,并且将混合比例从5:1大幅提升到了7:1,兼顾了超大规模与极高的推理效率。
搭配轻量级的MTP多Token预测层,模型在处理高达1M Token超长上下文时依然能够保持极快的生成速度。
为了支撑如此庞大的模型训练与运行,小米AI团队与北京大学联合研发了统一资源管理系统ARL-Tangram。
这套系统采用了统一的动作级公式和弹性调度算法,完美解决了异构资源约束的难题,将平均动作完成时间提升了高达4.3分。
在真实世界的智能体强化学习任务中,该系统让训练步骤的持续时间至多缩短了1.5倍,直接将算力成本与外部资源消耗大幅降低了71.2%。

在具体的性能表现上,MiMo-V2-Pro交出了一份相当亮眼的成绩单。
根据Artificial Analysis的最新评测,它成功拿下了国产第二、全球第八和的优异排名。

在评估通用智能体能力的权威基准中,它在PinchBench上获得了84.0的高分,在ClawEval中也拿到了61.5分,整体表现全面超越了Gemini 3 Pro,并逼近Claude Opus 4.6。

而在代码能力方面,它在SWE-bench Verified测试中取得了86.7分,直接超越了Claude 4.6 Sonnet,展现出极强的系统设计与复杂任务规划水准。
此前在OpenRouter平台上以Hunter Alpha代号进行盲测时,它的总调用量迅速登顶。

其中,OpenClaw贡献了675B Token的使用量,Kilo Code和Roo Code也分别达到了50.1B和38.6B Token,这些硬核的代码开发工具充分验证了它在生产环境中的极致可靠性。

为了检验实战水平,小米团队把它接入了OpenClaw框架进行前端开发测试。
只需要一段提示词它就能生成带有1990年代复古杂志风格的网页,无论是排版还是噪点滤镜都处理得非常到位。

MiMo-V2-Omni作为全模态模型,最大的亮点在于它把图像、视频和音频编码器融合进了一个主干网络里。
它能像人类一样同时看、听和读,并且可以直接把感知转化为行动。
在实际测试中,它能充当自动驾驶的视觉大脑提前预测潜在危险,还能作为智能体基模,完全自主地在浏览器里完成跨平台比价和购物,将各种工具调用和界面交互处理得游刃有余。
MiMo-V2-TTS则是一个专门给智能体赋予感情的语音模型。
只要直接用自然语言输入提示词,就能精确控制它的音色和情绪走向。
它不仅能根据上下文自动判断该用什么语气说话,还能特别自然地加入咳嗽、叹气或者笑声这些细节。
在谜底正式揭晓之前,Hunter Alpha和Healer Alpha的身份曾经引起了全球网友的广泛好奇。
它们亮相于3月11日,随后在OpenRouter上的调用量连续多日霸榜,总使用量迅速突破了1T Token。
就连龙虾之父Peter Steinberger也在X上发帖询问,有没有人知道这两款模型的具体细节。

有人猜是OpenAI,毕竟拿神秘模型在OpenRouter上试水已经是OpenAI的惯例了,而且命名习惯也很符合OpenAI的调性。

但考虑到Peter已经被OpenAI收编,不知道自家模型显得不是那么合理,当然也不排除OpenAI对内保密,或者Peter也在演戏的可能。
不过也有人从测试中发现,这个模型自称主要使用中文训练,因此可能来自中国,被猜测是DeepSeek-V4。

当然,也有在模型亮相早期就猜到这两款模型来自小米的,在3月14日就有网友在小红书上提及过这一传闻。

今晚,小米就要召开新的发布会了,在这个时间点公开模型身份,或许是在给新产品做铺垫。
如果你对小米的这三款新模型感兴趣,可以亲手试一下。
模型介绍:
https://mimo.xiaomi.com/mimo-v2-pro
https://mimo.xiaomi.com/mimo-v2-omni
https://mimo.xiaomi.com/mimo-v2-tts
文章来自于“量子位”,作者 “克雷西”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales