刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

8884点击 2026-03-19 08:55

智东西3月19日消息，今日凌晨，小米MiMo大模型系列重磅三连更：旗舰基座大模型MiMo-V2-Pro、全模态Agent模型MiMo-V2-Omni、MiMo-V2-TTS，其最新发布的这三大模型都是为优化智能体能力打造。

其中，上周在全球最大API聚合平台OpenRouter上，API调用量多天登顶日榜并引起热议的匿名模型Hunter Alpha、Healer Alpha，就是MiMo-V2-Pro、MiMo-V2-Omni的早期测试版。目前这两个匿名模型在OpenRouter仍然向开发者免费开放。

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

此前，因与DeepSeek V4被曝出的参数规格一样，还有人猜测Hunter Alpha就是DeepSeek V4。OpenClaw创始人Peter Steinberger还曾在社交平台X上发文打听这俩匿名模型的具体信息。

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

旗舰基座模型MiMo-V2-Pro总参数量超过1T，在OpenClaw、Claude Code等智能体框架中，MiMo-V2-Pro能够在无人工干预的条件下完成复杂工作流编排、长程规划与精准工具调用，但其模型API定价仅为Claude Opus 4.6的1/5。

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

▲MiMo-V2-Pro与Claude Opus 4.6、Claude Sonnet 4.6价格对比（图源：小米MiMo官网）

全模态基座模型Xiaomi MiMo-V2-Omni，支持文本、视觉、语音全模态，该模型能够跨模态理解复杂环境、自主制定并执行计划、在遇到异常时实时修正策略，最终端到端地交付完整结果。

语音合成大模型Xiaomi MiMo-V2-TTS要让智能体能用有温度、有情感、有灵魂的声音与人对话，其支持多方言、多角色、多语气生成，还可以智能识别文本中的标点符号、语气词、强调标记等各类格式信号。

此外，在MiMo-V2-Pro官方模型体验页面，小米还同步上线了MiMo Claw，用户可以体验基于MiMo-V2-Pro“养虾”。该功能创建一次可免费体验30分钟，退出使用后自动销毁数据。

小米MiMo大模型负责人正是原DeepSeek核心成员、被业内称为“天才少女”的罗福莉。

智东西体验了MiMo Claw，让其“帮我设计一个网站，每天19点更新第二天在港交所、A股上市的企业”。MiMo Claw通过Python爬虫定时抓取数据，然后生成静态页面直接部署。其运行测试发现误匹配后，会修正补充港股数据。

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

▲MiMo Claw生成的新股雷达网站

MiMo-V2-Pro、MiMo-V2-Omni将联合OpenClaw、OpenCode、KiloCode、Blackbox及Cline等智能体开发框架团队，为全球开发者提供为期一周的限时免费接口支持。

MiMo-V2-Pro养虾体验页面：

https://aistudio.xiaomimimo.com

MiMo-V2-Pro：综合能力国内第三

OpenClaw榜单排第三

MiMo-V2-Pro总参数量超过1T，激活参数量42B，较前代模型MiMo-V2-Flash扩大约3倍，支持100万上下文长度。

在全球权威大模型综合智能排行榜Artificial Analysis上，MiMo-V2-Pro位列全球第九，国内第三，仅次于智谱的GLM-5、MiniMax昨日新发布的MiniMax-M2.7。

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

在各个衡量模型重要能力的基准测评中，MiMo-V2-Pro在编程Agent、通用Agent和工具使用方面与Claude Sonnet 4.6、GPT 5.2、Gemini 3.0 Pro性能相近。

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

根据官方信息，MiMo-V2-Pro专为Agent场景深度优化，针对复杂多样的智能体架构进行了监督微调和强化学习，具备更强工具调用与多步推理能力。

在OpenClaw标准评测榜单PinchBench、Claw-Eval上，MiMo-V2-Pro排名第三，仅次于Claude Sonnet 4.6、Claude Opus 4.6。同时，基于1M超长上下文窗口，MiMo-V2-Pro能支撑高强度的真实Claw复杂应用流。

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

编程方面，小米内部工程师深度评测结果显示，

在前端应用场景中，MiMo-V2-Pro可以在OpenClaw里，一步生成设计精致、功能完备的网页。

提示词：模仿90年代印刷杂志美学。标题衬线字体如 Playfair Display，正文等宽字体如 IBM Plex Mono。页面杂志式多栏 grid，每栏宽度不等。大标题向左偏出视口暗示印刷溢出。图片加 sepia 0.2 棕褐色滤镜和噪点叠加。页面过渡模仿翻书效果。导航模仿杂志目录，每项前编号 01/02/03，hover 时编号变大。底部设计成杂志版权页样式含假 ISSN 号。纸张纹理背景。

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

价格方面，根据使用量分段计价：256K上下文以内，输入每百万tokens 1美元（约合人民币6.87元），输出3美元（约合人民币20.62元）；1M上下文以内，输入每百万tokens 2美元（约合人民币13.75元），输出6美元（约合人民币41.24元）。

在官方模型体验页面，同步上线了MiMo Claw，免费解锁MiMo-V2-Pro养虾体验。此外，MiMo Claw模块现已全面打通金山WebOffice生态，原生支持Word、Excel、PPT、PDF四大主流格式，覆盖超95%的日常文档类型；小米浏览器目前也已经接入MiMo-V2-Pro，助力AI搜索。

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

MiMo-V2-Omni：专攻多模态交互、执行

能帮你找攻略砍价

全模态基座模型Xiaomi MiMo-V2-Omni，是专为现实世界中复杂的多模态交互与执行场景打造，融合文本、视觉、语音全模态。

感知能力，精准感知和准确推理是高效执行的基石。在音频理解上，MiMo-V2-Omni支持从环境声分类、多说话人分离、音频-视觉联合推理、超过10小时连续长音频的深度理解。其表现超越了Gemini 3 Pro；图像理解上，MiMo-V2-Omni具备多学科视觉推理与复杂图表分析能力，其表现超过Claude Opus 4.6，逼近Gemini 3 Pro；视频理解方面，新模型支持原生音视频联合输入，表现超越Gemini 3 Flash。

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

智能体能力方面，MiMo-V2-Omni能够跨模态理解复杂环境、自主制定并执行计划、在遇到异常时实时修正策略，最终端到端地交付完整结果。

在与真实数字环境交互的评测基准上，MiMo-V2-Omni性能逼近Gemini 3 Pro，纯文本智能体任务上，其平均表现仅次于Claude Opus 4.6。

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

结合OpenClaw框架，MiMo-V2-Omni可以像人一样操控浏览器。

提示词：帮我看看小米17怎么选，去小红书做做功课，选好了去京东下单，顺便砍砍价。

模型会自己打开小红书翻帖子，提取配置对比、拍照评测、真实用户体验然后整理购买建议。然后其会打开京东跨店比价，转接人工客服砍价，价格合适后直接加购下单。

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

MiMo-V2-Omni接入WPS Office，只需几句话就可以为用户直接生成Word、结构化Excel、排版规范的PDF与完整的PPT。

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

MiMo-V2-Omni模型支持256K上下文长度，输入每百万tokens 0.4美元（约合人民币2.75元），输出2美元（约合人民币13.75元）。

MiMo-V2-TTS：上亿小时语音数据训练

让智能体说话更像人

语音合成大模型Xiaomi MiMo-V2-TTS，专为Agent时代的全模态交互而生，让智能体能用有温度、有情感、有灵魂的声音与人对话。

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

该模型基于小米自研Audio Tokenizer和多码本语音-文本联合建模架构，经过上亿小时语音数据的大规模预训练与多维度强化学习，实现了高度可控的多粒度语音风格控制。

其中，自研多码本语音建模架构，可以实现更精细的语音特征捕捉与还原，模型在高保真的离散token空间中对语音进行建模，保留原始语音中的丰富信息，使强化学习阶段能够直接利用语音相关奖励信号对模型进行优化，从而让多维奖励信号更有效。

语音数据量突破上亿小时，覆盖丰富的说话风格与场景；多维度强化学习后训练中，MiMo-V2-TTS在能围绕更自然的韵律、更稳定的音质、更准确的字词表达、更高质量的音色克隆以及不同场景下恰当的语气和表达方式等多个维度持续优化。

在训练过程中，MiMo-V2-TTS首先通过超大规模语音-文本混合预训练，在海量数据中习得了强大的跨模态对齐与理解生成的统一能力；在此基础上，通过少量高质量监督数据的微调，模型获得了可泛化的多粒度与多风格指令控制能力。

可泛化的语音风格指令控制：该模型支持从整体到局部的多层次语音风格控制。用户可通过自然语言指令设定整体语音基调，同时对句内局部片段进行细粒度的情绪调节，实现同一语句中语气转折与情感递变的自然过渡。

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

文本理解：该模型在预训练阶段通过大量文本-语音对齐数据，习得了书面语与口语表达之间的映射关系，能够智能识别文本中的标点符号、语气词、强调标记等各类格式信号，并将其自动转化为恰当、自然的语音表达，全程无需用户额外标注或手动干预。

方言、角色、歌声：该模型支持多种方言的自然发音，可进行角色扮演式的风格化演绎，更能实现高质量的歌声合成——让同一个模型既能说、能演、也能唱。方言支持：东北话、四川话、河南话、粤语、台湾腔。

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

结语：终端厂商发力系统级原生智能体

小米大模型团队透露了下一步的研发方向，小米大模型Core团队的核心方向是攻克高复杂度推理与长周期任务规划，系统提升模型在未知环境中的泛化与决策能力，向真正的通用智能迈进，其还将持续推进长周期智能体规划、实时流式感知、多智能体协同，以及与物理世界更深层的整合。

小米此次连发三个大模型，贯通了万亿参数模型、全模态模型、平价API等多项能力，这或许也意味着终端厂商可以把底层大模型、系统权限、生态服务深度整合，打造系统级原生智能体。

文章来自于微信公众号 “智东西”，作者 “智东西”

关键词: AI新闻 , MiMo , MiMo-V2-Pro , MiMo-V2-Omni , MiMo-V2-TTS , 小米模型

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

AI爬虫

【开源免费】ScrapeGraphAI是一个爬虫Python库，它利用大型语言模型和直接图逻辑来增强爬虫能力，让原来复杂繁琐的规则定义被AI取代，让爬虫可以更智能地理解和解析网页内容，减少了对复杂规则的依赖。
项目地址：https://github.com/ScrapeGraphAI/Scrapegraph-ai

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址：https://github.com/InternLM/MindSearch
在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。
项目地址：https://github.com/miurla/morphic/tree/main
在线使用：https://www.morphic.sh/

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。
项目地址：https://github.com/Henry-23/VideoChat
在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址：https://github.com/PeterH0323/Streamer-Sales