Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月
6648点击    2025-08-13 15:57

你好,我是杰哥。


Artificial Analysis 最近发布了《State of AI: China Q2 2025 Highlights Report》(2025年Q2 中国人工智能现状分析报告),聚焦中国 AI 发展现状。


Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月


报告通过全面基准测试,包括语言模型API的性能评估和人群 sourced 竞技场投票,分析了AI技术和用例。数据来源于 Artificial Analysis Intelligence Index,该指数整合了7项评估:MMLU-ProGPQA DiamondHumanity's Last ExamLiveCodeBenchSciCodeAIMEMATH-500。报告强调,中国 AI 实验室在前沿模型智能上迅速追赶美国,差距显著缩小。以下是报告的核心内容整理,力求准确、客观。


中美 AI 前沿差距缩小


Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月


报告指出,中国领先 AI 实验室与美国领导者的性能差距已从 ChatGPT 发布后的超过一年,缩小到不到三个月。具体而言,自 2022 年 ChatGPT 发布以来,中美前沿语言模型的差距持续存在,但如今已达到历史最小。DeepSeek的开源权重模型 R1(2025 年5月发布)领导中国AI实验室,而 OpenAIo3 是美国最领先模型。中国进展主要由 DeepSeekAlibaba 驱动,美国则主要依赖 OpenAI


Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月


在开源权重模型方面,中国于2024年11月通过 AlibabaQwQ 32B Preview 超过美国(超越 MetaLlama 3.1 405B)。DeepSeekR1(2025年1月)是首个与中国 OpenAI o1 竞争的开源权重推理模型,而 R1 0528(2025年5月)则是当前最智能的开源权重模型。这反映了中国顶级AI实验室倾向于发布旗舰模型权重,与美国实验室(如 OpenAIAnthropicGoogle)的封闭策略形成对比。


中国领先 AI 实验室的稳步推进


Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月


DeepSeekAlibaba 是中国AI前沿的主要推动者。截至2025年5月,DeepSeek R1 0528 在智能上略领先 AlibabaQwen3 235B A22B。两家公司均采用开源权重策略,促进模型在国内外广泛采用。在过去两年,它们每隔最多约3个月发布新模型。


Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月


DeepSeek 的模型智能自2023年11月首次发布以来快速提升:从 DeepSeek LLM 67B(智能指数20)到 V2(35)、V2.5(46)、V3(60)、R1(68),再到 R1-0528(68)。R1-0528 是对 V3/R1 架构的后训练更新,无需改变671B参数(活跃37B),突显强化学习(RL)技术在推理模型中的重要性。这使 DeepSeek 跃升为全球第二AI实验室,与 xAIMetaAnthropic 并列,并成为无可争议的开源权重领导者。


美国AI实验室竞争加剧


Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月


在美国,OpenAI 的主导地位减弱。其他实验室如 GooglexAIAnthropic 已缩小差距。截至2025年5月,OpenAI o3 是美国最智能模型(整体最智能)。GoogleGemini 2.5 ProxAIGrok3 mini reasoning (high)AnthropicClaude Opus 4 (Extended Thinking) 紧随其后。


中国AI玩家的分类与生态


报告将中国AI玩家分为三类:大科技公司AI初创公司,以及其他有 AI 野心的公司


Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月


大科技公司包括:


Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月


  • Alibaba:市值约300B美元,策略包括发布领先开源模型(如 Qwen)和通过 Alibaba Cloud 提供推理。最佳非推理模型 Qwen3-235B-A22B(智能47),最佳推理模型 **Qwen3-235B-A22B (Reasoning)**(62)。消费者应用 Tongyi Qianwen(约150M MAU)。


  • ByteDance:私有公司,拥有 Doubao(约110M MAU)。最佳非推理 Doubao 1.5 Pro(48),最佳推理 Seed-Thinking-v1.5(62)。通过 Volcano Engine 提供服务。


  • Huawei:私有,专注芯片和硬件。最佳非推理 Pangu 5.0 Large(未基准),无公开推理模型。应用 Celia(约200M MAU)。


  • Tencent:市值约575B美元。最佳非推理 Hunyuan TurboS(47),最佳推理 Hunyuan T1(59)。应用 YuanbaoYuanqi(约40M MAU)。


  • Baidu:市值约30B美元。最佳非推理 ERNIE 4.5(46),最佳推理 ERNIE X1(60)。应用 Wenxin Yiyan(约13M MAU)。


AI初创公司包括:


Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月


  • DeepSeek(2023年5月成立):最佳非推理 DeepSeek V3(52),最佳推理 DeepSeek R1(68)。应用 DeepSeek Chat(约100M MAU)。资金 undisclosed。


  • Moonshot AI(2023年3月):最佳非推理 Moonshot v1(30),最佳推理 Kimi K1.5(58)。应用 Kimi(约25M MAU)。资金约1.6B美元。


  • Zhipu(2019年6月):最佳非推理 GLM-4-32B(46),最佳推理 GLM-Z1-32B(56)。应用 ChatGLM(约9M MAU)。资金约1.1B美元。


  • StepFun(2023年4月):最佳非推理 Step-2(44),最佳推理 Step-R1-V-Mini(55*)。应用 YuewenPopDuck(<1M MAU)。资金 undisclosed。


  • MiniMax(2021年12月):最佳非推理 MiniMax-Text-01(40)。应用 Talkie AI(约35M MAU)。资金约0.85B美元。


  • 01.AI(2023年3月):最佳非推理 Yi-Lightning(37*)。应用 YiChat(<1M MAU)。资金约0.2B美元。


  • Baichuan(2023年4月):最佳非推理 Baichuan 4(31),最佳推理 Baichuan M1(52)。应用 Bai Xiaoying(<1M MAU)。资金约1.0B美元。


其他公司如 Kunlun Tech360 SecurityiFlytekMeituanXiaomi 也在AI领域活跃。


领先语言模型与开源前沿


Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月


中美领先模型比较显示,美国整体领先,但中国不再落后。顶级中国模型包括 DeepSeek R1 (May 2025)(68)、Alibaba Qwen3 235B A22B (Reasoning)(62)、ByteDance Seed-Thinking-v1.5(62)。美国包括 OpenAI o3(70)、Google Gemini 2.5 Pro(68)、**xAI Grok 3 Mini Reasoning (high)**(67)。


Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月


开源权重前沿由 DeepSeek 领导:推理模型 **R1 (May 2025)**(68),非推理 V3(52)。中国在推理(如 Qwen3 235B A22B (Reasoning) 62)和非推理(如 Qwen3 235B A22B 47)中占有显著份额。


多模态AI与媒体生成进展


中国公司在语言、语音、图像、视频和 3D 生成中全面参与。例如,Alibaba 在图像(LHM)和视频(Wan 2.1),ByteDance 在 TTS(Seed-TTS)和视频(Seaweed-7B)。


Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月


在文本到图像,2025年中美达到 parityOpenAI GPT-4o(1165 ELO)略领先 ByteDance Seedream 3.0(1161)。其他如 MiniMax Image-01(1111)。


文本到视频由美国领导,Google Veo 3 Preview(1247 ELO)远超 Kuaishou Kling 2.0(1133*)。中国如 MiniMax T2V-01(1053)、Alibaba Wan 2.1(1039)。


Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月


图像到视频类似,美国领先,Google Veo 3(1222)略超 Kuaishou Kling 2.0(1206)和 Runway Gen 4(1199)。


Artificial Analysis 重磅发布《2025年Q2中国AI现状报告》:中国与美国差距已从一年缩短至3个月


结语


2025年Q2 中国人工智能现状分析报告》显示,中国 AI 生态处于蓬勃发展中,尤其是在开源多模态领域并且正在快速缩小与美国的差距


添加官方客服微信 openai178,免费获取完整PDF报告~


文章来自于微信公众号“AI信息风向”,作者是“舒米勒杰哥”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

2
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales