我们开源了 MiniMax M3

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
我们开源了 MiniMax M3
8157点击    2026-06-16 10:34

我们在上周五开源了 MiniMax M3 模型权重,同步发布了 MSA(MiniMax Sparse Attention)技术论文。MSA 的架构设计让 M3 在长上下文下的计算成本大幅降低,论文中完整披露了架构与工程实现细节。


M3 是 MiniMax 的原生多模态旗舰模型,总参数 428B,激活参数 23B。M3 是第一个从 Step 0 开始做多模态混合训练的开源模型。


训练阶段,我们使用了大量文本、图像和其他模态交错排列的数据,让不同模态的语义空间从预训练阶段就深度融合。这种设计使模型在预训练阶段就建立起统一的跨模态语义空间,也为后续多模态理解、生成和复杂任务融合提供了底层基础。


发布两周以来,M3 在 Artificial Analysis 综合智能指数排行榜上取得了全球开源模型的最高排名,也收到了来自开发者、研究者和行业用户的大量实测反馈。


我们开源了 MiniMax M3


Vercel CEO Guillermo Rauch 给予 M3 积极评价


我们开源了 MiniMax M3


YC Founder Jinjing Liang 分享 M3 实测体验


我们开源了 MiniMax M3


Happycapy Co-founder Victoria Wu 实测评价


我们开源了 MiniMax M3


Artificial Analysis 综合智能指数开源模型第一


我们开源了 MiniMax M3


GDPval-AA 排行榜开源模型第一


我们开源了 MiniMax M3


Code Arena WebDev 榜单


跻身帕累托最优模型序列,提供最高性价比


我们开源了 MiniMax M3


Vals.AI 榜单国产模型第一名,在金融与 Coding 任务上表现亮眼


针对访问量激增带来的体验问题,我们在持续优化,目前 M3 的输出速度已从上线时的约 30 TPS 提升至约 80 TPS,接下来还会继续提速 30-40%,模型响应将更加流畅。Token Plan 后台也上线了调用量看板,用户可以直观查看当前用量及剩余额度,方便大家合理规划用量与成本。


我们听到了大家对模型的期待。在反馈中,最集中的诉求就是模型服务的稳定性、真实负载下持续可用、以及以合理成本规模化部署的可行性——


随着大模型被广泛应用于生产级任务,许多企业与个人的工作流被 Agent 接管,AI 渗透率快速提升。同时其中有大量的长程复杂任务,有的任务 Agent 能够连续运行数小时甚至数天,Token 消耗随之急剧增长。相应地,越来越多团队开始在模型能力、使用成本与稳定性之间权衡,力求找到最契合自身业务场景的平衡点。


M3 模型在研发初期便确立了方向:在确保模型能力在复杂推理、长文本、多模态等场景中足够智能的前提下,真正实现对开发者、用户和企业客户的普惠。


在后续的模型迭代中,我们将持续坚守这一初心,更加开放、加速进步。


开源地址:


Github: github.com/MiniMax-AI/MiniMax-M3


Hugging Face: huggingface.co/MiniMaxAI/MiniMax-M3


MSA 论文:


arxiv.org/abs/2606.13392


Intelligence with Everyone.


文章来自于微信公众号 “MiniMax 稀宇科技”,作者 “MiniMax 稀宇科技”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md