过往几个月,我们通过 MiMo Orbit、百万亿 Token 创造者激励计划等活动,让更多人有机会体验 MiMo ,并解决真实的问题——这是 MiMo 在规模化应用道路上的第一步。
而现在,随着底层技术的不断精进,我们终于可以做一件更彻底的事——对整个模型价格体系进行一次永久性翻新。
本次公告核心速览:
生效时间:北京时间 2026 年 5月 27日 0 点
MiMo-V2.5系列API永久降价
相比原始 API 定价,新定价最高降幅可达 99%,且不再区分上下文窗口长度。

本次调价于北京时间 5 月 27 日 0:00 正式生效,全球同步调整,诚邀各位开发者接入体验。


百万亿 Token创造者激励计划圆满收官
「百万亿 Token 创造者激励计划」自 4 月 28 日上线以来,受到全球用户的热情追捧和广泛关注,截至北京时间 5 月 26 日 16:08,100T Tokens 已全部提前发放完毕,活动提前收官、圆满结束,感谢广大开发者的踊跃参与!
注:Apache 软件基金会成员专属福利活动长期有效、可继续申请,不受本次收官影响。

惊喜:现有 TokenPlan 用户额度全量重置
无论当前套餐用量如何,所有已订阅 Token Plan 且当前仍在有效期的用户(包括参与百万亿 Token 创造者激励计划并获得 Token Plan 的用户,涵盖 Apache 软件基金会专属福利用户)的 Credits 额度将于北京时间 5 月 27 日 0:00 全量重置,并按新计费规则执行。
One More Thing:针对 Token Plan 已过期的历史付费用户,我们也同样准备了惊喜好礼,将在未来一周宣布,请保持关注。
推理技术优化说明
本次价格调整背后,离不开小米技术团队在推理系统上的持续优化。
我们基于 SGLang HiCache 完整支持 SWA(Sliding Window Attention),将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近 1/7,并将可缓存 token 数量提升至优化前的近 5 倍,显著提升了缓存命中率和推理效率。
同时,我们通过优化专家并行方案、输入长度分桶策略等,进一步提升了集群输入吞吐能力,从而在保障服务质量的前提下持续降低单位 token 服务成本。
后续我们将发布更加详细的推理优化技术 Blog,敬请期待。
结语
技术的价值,最终要体现在被使用的广度上。
依靠技术的持续创新,我们希望通过提供兼具低成本与顶尖能力的模型服务,撬动真实、持续、规模化的推理需求,推动完整 AI 基础设施链条的建设。
让更多的人能用到更好的模型——这是 MiMo 不变的使命。

文章来自于微信公众号 "Xiaomi MiMo",作者 "Xiaomi MiMo"
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md