Qwen拿半成品刷下AIME'25满分,给别人留点面子吧……
Qwen拿半成品刷下AIME'25满分,给别人留点面子吧……半成品模型,已经刷下高难度数学推理测试AIME 25满分战绩。
来自主题: AI资讯
5889 点击 2025-11-04 17:32
半成品模型,已经刷下高难度数学推理测试AIME 25满分战绩。
新一代旗舰模型Qwen3-Max带着满分成绩,正式地来了——国产大模型首次在AIME25和HMMT这两个数学评测榜单拿下100分!和前不久Qwen3-Max-Preview一致,参数量依旧是超万亿的规模。
总参数达到1万亿,阿里迄今为止最大的模型来了! 没错,就是前几日大家期待已久的Qwen3-Max-Preview (Instruct)。
阿里迄今为止,参数最大的模型诞生了!昨夜,Qwen3-Max-Preview(Instruct)官宣上线,超1万亿参数性能爆表。在全球主流权威基准测试中,Qwen3-Max-Preview狂揽非推理模型「C」位,直接碾压Claude-Opus 4(Non-Thinking)、Kimi-K2、DeepSeek-V3.1。