首个为智能体构建的开放前沿模型
NVIDIA Nemotron 3 Ultra 是 NVIDIA 推出的首款专为智能体打造的开放前沿大模型,拥有 5500 亿参数的混合专家架构,结合了 Mamba 与 Attention 混合设计。它能实现每秒 300+ 令牌生成速度,支持 100 万令牌长上下文窗口,在 Artificial Analysis Intelligence Index 中排名顶尖的美国开源权重模型,专为需要前沿推理能力的多步智能体循环设计,目前已在 Hugging Face、OpenRouter、ModelScope 以及 build.nvidia.com 以 NIM 微服务形式提供使用。


