3 月 31 日,智谱(02513.HK)发布上市后首份年度业绩。2025 年全年收入 7.24 亿人民币,同比增长 132%,是国内收入规模最大的大模型公司
同时,MaaS API 平台 ARR 约 17 亿人民币(约 2.5 亿美金),过去 12 个月增长 60 倍
一季度 API 涨价 83%,调用量反增 400%

智谱上市后首份成绩单
先说背景。从 2024 年年中开始,国内大模型行业集体打价格战。1 分钱百万 Token、免费调用成了常规操作。据调研数据,2024 年国内大模型行业平均毛利率 -80%,2025 年行业平均毛利率仍为 -30%,绝大多数厂商还在亏钱换规模
在这个环境里,智谱做了一个跟所有人方向相反的动作:2026 年一季度,API 定价上调 83%
结果是调用量不降反升,增长 400%。据财报披露,智谱已成为国内付费 Token 消耗量最高的厂商之一
行业毛利率 -30%,智谱综合毛利率 41%涨价 83%,调用量反增 400%
量价齐升在全球 AI 行业都很少见。对于生产级客户来说,价格从来不是第一考量,模型效果才是。一个能稳定完成复杂任务的模型,即使贵一些,也比便宜但不稳定的模型更值钱
据智谱官方表述,GLM 系列持续保持全球开源模型第一、中国模型第一,在全球模型中仅次于 GPT、Claude 和 Gemini。GLM-5 在 Artificial Analysis Intelligence Index 榜单达到 50 分,据称是开放权重模型首次达到这一分数
2025 年全年收入 7.24 亿人民币,同比增长 132%。对比招股书数据,2024 年全年收入 3.124 亿,2025 上半年 1.91 亿。下半年收入约 5.33 亿,是上半年的 2.8 倍
全年综合毛利率 41%,MaaS 平台毛利率从约 3.8% 提升至 18.9%,提升近 5 倍
MaaS API 平台 ARR 约 17 亿人民币(约 2.5 亿美金),过去 12 个月提升 60 倍。400 万企业用户及开发者在真实生产环境中持续调用,覆盖全球 218 个国家和地区
招股书阶段,市场对智谱的印象是「做大模型服务的AI公司」,本地化部署收入占比约七成。这份年报里,API 调用业务的 ARR 已经远超全年确认收入,MaaS 成了增长的主引擎
MaaS(Model as a Service),把大模型能力封装成标准化 API,企业和开发者按调用量付费。这正是 Anthropic 跑通的商业路径:80% 以上的收入来自企业和开发者的 API 调用
这个模式的核心是一个正向循环:模型效果越好 → 吸引高价值客户 → 客户深度调用带来收入 → 收入投入技术研发 → 模型效果进一步提升
收入结构从「模型服务」切换到了「API 调用」
中国前十大互联网公司中有 9 家 每天深度调用 GLM。GLM-5 发布后 24 小时内,字节跳动 TRAE、阿里 Qoder、腾讯 CodeBuddy、美团 CatPaw、快手万擎、百度智能云、WPS Office 等头部产品官方接入
全球化维度上,GLM 已部署在 Google Vertex AI、AWS Bedrock、Fireworks、Cerebras 等云服务商,入驻 OpenRouter、Vercel 等聚合平台。据智谱称,GLM 是 OpenRouter 付费模型排名第一,也是 Windsurf、OpenCode 等 Coding 平台的默认模型
Coding 和 Agent 两条线都在放量。Coding Plan 全球付费开发者 24.2 万,Token 调用量 6 个月涨 15 倍。2026 年 3 月推出的 Claw Plan(基于 AutoClaw),上线两天订阅用户破 10 万,20 天突破 40 万
张鹏在业绩发布会上把智谱的商业路径定义为「中国的 Anthropic」。Anthropic 的 ARR 从 2024 年底约 10 亿美金,到 2025 年底约 90 亿美金,到 2026 年 3 月已经接近 190 亿美金。Claude Code 单产品 ARR 超过 25 亿美金。约 70-80% 的收入来自企业级 API 调用
智谱的 MaaS ARR 约 2.5 亿美金,增长曲线的形态跟 Anthropic 同构:模型能力够强之后,API 调用量指数级爆发
几个同构点:
· 收入来源都以 API 调用为主。Anthropic 约 70-80% 来自企业 API,智谱的 MaaS 平台是核心增长极
· 都以 Coding 为切入点。Anthropic 的 Claude Code 9 个月 ARR 破 25 亿美金,智谱的 Coding Plan 付费开发者 24.2 万,Token 调用量 6 个月涨 15 倍
· 都能涨价。Anthropic 在规模扩张中保持定价能力,智谱一季度涨价 83% 后调用量反增 400%
Anthropic 估值 3800 亿美金,约 27 倍 ARR。智谱港股市值约 800 多亿港币。Anthropic 的 Fortune 100 客户覆盖率 70%,开发者和企业客户生态更成熟

Anthropic 和智谱核心指标对比,数据来源为公开报道和财报
MaaS 平台毛利率从约 3.8% 跳到 18.9%,背后有几个技术因素
智谱通过 MLA-256 改进在保持与 GQA-8 相同性能的情况下,减少了 KVCache 占用。动态稀疏注意力机制 让长序列推理的部署成本降低 50%,性能无损。这些是推理侧的工程优化,直接压低了每个 Token 的成本
训练侧,Slime 框架 实现异步强化学习,解决了生成与训练的解耦问题。通过 PD 分离和心跳容错机制最大化 GPU 利用率。配合直接双面重要性采样算法,模型可以从超 1 万个真实软件工程环境中高效学习。这套体系支撑了 GLM-5-Turbo 作为 OpenClaw 基座模型
国产芯片适配方面,GLM-5 已进入软硬协同设计阶段。通过 Lightning Indexer 等定制化融合内核和 FlashComm 通信优化,据智谱称在国产芯片上跑出了接近国际顶级芯片的推理效率
MaaS 是一个边际成本持续下降的模式。模型训练和优化一次,可以服务数百万客户,调用量越大,单 Token 成本越低,毛利率越高。推理成本的持续优化直接推动了毛利率 5 倍的提升
张鹏在业绩会上提出了两个概念
TAC(Token Architecture Capability,Token 架构力):TAC = 智能调用量 × 智能质量 × 经济转化效率。按张鹏的说法,未来衡量组织和个人价值的标准,会越来越取决于其构建和驱动复杂 Agent 系统的能力。智谱的定位是成为提升全社会 TAC 的基础设施
LLM-OS(大模型操作系统):把大模型定义为智能的调度者。张鹏说智谱在与生态伙伴和操作系统厂商探讨,把基座模型能力与操作系统深度融合。AutoGLM 和 AutoClaw 是这一方向的落地
在业绩会 Q&A 中,有记者直接问这两个概念是愿景还是产品计划。张鹏的回答是 TAC 已经在发生(「有些企业已经把 Token 作为工资的一部分发放」),LLM-OS 也在与合作伙伴推进中
TAC 和 LLM-OS 目前还是概念框架,落地产品有限。但 TAC 的公式(调用量 × 质量 × 转化效率)跟智谱当前的商业逻辑是自洽的
盈利时间表。招股书显示 2024 年净亏损 29.58 亿,2025 上半年净亏损 23.58 亿。研发投入(主要是算力)的体量决定了短期内盈利仍需时间。Anthropic 预计 2027 年停止现金消耗,可以作为参考
大厂自研。9/10 的头部互联网公司在用 GLM,但字节、阿里、腾讯都有自研模型。张鹏在 Q&A 中的回应是:大厂在所有场景中都做到竞争力最强,受资源限制很难实现,生态本身也需要接入外部供应商
定价权的持续性。涨价 83% 后调用量增 400%,这组数据很硬。张鹏也提到当前确实存在算力供给的约束。后续算力供给充裕之后,需求侧的表现需要持续观察
Anthropic 的商业路径已经跑通了:做最强的基座模型,通过 API 卖推理,让开发者和企业在生产环节消耗 Token。ARR 15 个月从 10 亿美金到接近 190 亿美金
智谱这份财报里的数据跟 Anthropic 的早期增长曲线同构。MaaS ARR 12 个月增 60 倍,API 涨价 83% 后调用量增 400%,400 万开发者和企业在用 GLM,全年综合毛利率 41%
智谱开始用 Anthropic 的方式赚钱了
文章来自于微信公众号 "赛博禅心",作者 "赛博禅心"
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md