AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?
5339点击    2025-12-04 09:50

中美正忙着堆算力打AI战,欧洲却突然杀出一条血路:模型落地更重要!Mistral一口气扔出Large 3和Ministral 3,全开源、能看图、能跑在大多数电子设备上,甚至断网也能用。未来,AI是巨头的专属权力,还是人人都能握在手中的智能?这一次,欧洲给出了自己的答案。


就在昨天,「欧洲版DeepSeek」一口气公布了两件事:


  • 一个MoE大模型:Mistral Large 3
  • 一套小模型:Ministral 3(14B/8B/3B)


全部开源、全部多模态、全部能落地。


AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?


Mistral Large 3


这次Mistral推出的Mistral Large 3,规格上看几乎是「开源界的准天花板」:


41B active / 675B total的MoE架构、原生图像理解、256k context、多语言能力在非英中语种上强得离谱,LMArena排名直接杀到开源模型第6。


AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?

Mistral Large 3的ELO得分在开源大模型中稳居第一梯队,和Kimi K2打成平手,仅落后DeepSeek v3.2一小截


它的底模表现也不弱,在多个基础任务上与DeepSeek、Kimi这种体量更大的模型正面交手。


AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?

Mistral Large 3(Base)在MMLU、GPOA、SimpleQA、AMC、LiveCodeBench等多项基础任务上与DeepSeek 37B、Kimi K2 127B保持同一水平,属于开源系的第一梯队底模


再看预训练能力,它和Qwen、Gemma的底模在核心评测上也是正面硬刚:


AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?

Mistral Large 3在多个核心基准上与DeepSeek、Qwen正面对比


但官方却没把重点放在数值上,反而强调:


我们开源Apache 2.0,全权在你;你想怎么改、怎么部署都行


为了实现这一点,他们和NVIDIA做了一件简单,但却很关键的事:


为了让Large 3运行得更稳定,Mistral联合NVIDIA把底层推理链路重新做了一遍:


采用NVIDIA的FP4,并重写了Blackwell的注意力与MoE内核,让Large 3在Blackwell NVL72上既快、又稳、又便宜。


这不是简单的适配,而是把Blackwell的注意力机制、MoE内核、预填充/解码分离和投机解码等关键推理路径重新做了一遍。


AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?


Ministral 3系列


真正让Mistral得意的,是Ministral 3系列


它们体量小,但性能强。


3B、8B、14B三种大小,全部有base、instruct、reasoning三个版本,全部能看图,全部在官方benchmark里表现不俗。


这意味着:你的笔记本能跑,你的台式机能跑,无人机、机器人、汽车、边缘摄像头都能跑,甚至脱离互联网也能跑。


更关键的是,模型不只是「小」,而是「更聪明」。


Ministral 3的instruct版本在综合智能指数上的得分分别是31(14B)/ 28(8B)/ 22(3B)──全部跑赢上一代Mistral Small 3.2,参数量甚至多40%。


也就是说这代小模型不仅便宜、能跑在更多设备上,本身能力也从底层被拉升了一大截。


AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?


Large 3相比上一代Large 2提升了11分,达到38分。


但即便这样,它仍没有进入GPT-5、Gemini 3、Claude Opus那种顶级专有模型所在的第一梯队。


Artificial Analysis的综合榜单里,前排依旧被GPT-5、Gemini 3、Opus系列占据;


DeepSeek和Qwen也在持续贴近第一梯队,Mistral Large 3则恰好卡在两者之间。


AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?


这是一次可见的进步,但它的定位从来都不是「跑分之王」。


但这并不影响它的工程价值。Large 3用的是稀疏MoE架构,本身就很吃算力。


所以这次Mistral直接和NVIDIA深度绑定,把Blackwell 系列最新的注意力机制、MoE加速内核都接了上来。


AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?


最有意思的是,他们一起把「预填充 / 解码分离」和「投机解码」也做进了底层,让长文本、高并发这种企业级场景跑起来更稳、更快。


更关键的是,Ministral 3系列不仅体积小,它们已经被官方优化到能直接跑在各种真实设备上:DGX Spark、RTX PC、普通笔记本,甚至是 Jetson 这种嵌入式板子。


从数据中心到机器人,从工厂到无人机,只要有块GPU,就能跑Mistral的小模型。


AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?

Mistral Large 3(Instruct)在真实任务评估中对比 DeepSeek V3.1 / Kimi K2的胜率


再看reasoning版,AIME’25(数学推理)能在14B下做到85%。


AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?

Ministral 14B的底模实力远超同量级对手,在数学、知识问答、多语言任务中几乎全面领先Gemma 13B和Qwen 1.8B


AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?

Ministral 14B(Reasoning)在AIME’25、LiveCodeBench、GPOA Diamond、HMMT等推理任务上全面领先Qwen 14B「Thinking」,数学和代码推理几乎是同量级中的天花板。


AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?

Ministral 14B(Instruction)在WildBench、Arena Hard、数学推理和多模态任务上全面领先Gemma 13B与Qwen 1.8B,指令调优后的综合能力几乎碾压同量级模型。


这在小模型推理中,几乎是突破天花板的表现。


Mistral首席科学家Guillaume Lample一语点破:


超过90%的企业任务,用微调过的小模型就足够了。


这相当于对OpenAI的直接挑衅。


OpenAI的最强模型需要昂贵的显卡,每个token都在烧钱;Google、Anthropic的Agentic模型配置更高。


但企业真正要的是:能用、可控、便宜、可靠。


Ministral 3正是在针对这一痛点。


AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?


Lample在一次采访中提到这样一个有趣的现象:


很多公司用最强闭源模型做原型,结果上线时发现成本太贵、延迟太高,只能退回来找我们。


闭源头部模型有天然的缺陷:出了问题企业无法修复,企业数据必须上传云端,成本高的吓人......


Mistral直击要害:模型不够好?我们下场帮你造数据、帮你调模型。


他们直接派工程师进驻客户公司,把模型变成按需定制的「企业专属AI」。


用一个14B,干掉别人70B、400B的大模型,在企业场景里完全可能。


AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?

在真实人工评估中,Mistral Large 3在通用任务和多语言任务里对DeepSeek V3.1、Kimi K2取得53%–60%的胜率


Mistral的野心


把视线从模型本身移开,就会发现Mistral不仅仅是卖模型。


它在悄悄把自己变成一种平台型的存在,而那套结构现在已经清晰到让人无法忽视。


Mistral Agents API,它不仅能跑模型,还能直接在API内部接Code Interpreter、执行代码、接连工具、保持长期记忆、做结构化推理。


AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?


Magistral,专门为「复杂推理、透明推理、多语言推理」训练的模型系列。


还有突然爆火的AI Studio。官方称其能「部署在任何地方」。


AI三国杀!OpenAI狂卷,DeepSeek封神,却被Mistral偷了家?


由此可见,Mistral在走一种不同寻常的AI路线。


它不像美国那套「云端神谕」,更像是欧洲式的「软件制造业」哲学:


把能力做成标准件,让所有人随取随用。


Mistral 3的发布,让全球AI版图出现了一个新的裂缝。


一边是不断做大的「云端巨兽」,另一边是开始渗透到笔记本、无人机、工厂、公共机构里的「小而强AI」。


AI的未来到底属于几家巨头,还是属于每个人的设备、每个国家的生态?


这场争夺从今天才正式开盘。


参考资料:

https://mistral.ai/news/mistral-3

https://venturebeat.com/ai/mistral-launches-mistral-3-a-family-of-open-models-designed-to-run-on

https://x.com/MistralAI/status/1995872768601325836 https://x.com/ArtificialAnlys/status/1995946145236001168


文章来自于“新智元”,作者 “倾倾”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner