张亚勤院士：基础大模型最终不超过10个，十年后机器人比人多

张亚勤院士：基础大模型最终不超过10个，十年后机器人比人多 | MEET2026

7747点击 2025-12-12 08:55

从ChatGPT到DeepSeek，AI正沿着“智能+”的路径进入新一轮浪潮。

正值大模型从“算力堆叠”走向“推理优先”的关键节点，清华大学智能产业研究院（AIR）创始院长、中国工程院外籍院士张亚勤提出：

新一轮人工智能，是信息智能、物理智能和生物智能的融合，本质上也是原子、分子和比特的融合。

也就是说，在规模定律持续发挥作用的前提下，当参数规模、数据体量与算力资源跨过某个阈值，智能就不再只停留在模式识别，而是开始“涌现”——

先是从鉴别式AI走向生成式AI，再从生成式AI走向以智能体为代表的新范式。

在本次量子位MEET2026智能未来大会上，他也将ChatGPT和DeepSeek，视作这一轮演进中的两个重要里程碑：

前者通过统一表征与token化，把文本、语音、图像乃至蛋白质、点云等数据纳入同一空间；

后者则以高效率、高性能、低价格和开源路径，把大模型从“预训练时代”推向以推理为核心的“DeepSeek时刻”。

张亚勤院士：基础大模型最终不超过10个，十年后机器人比人多 | MEET2026

至于未来5~10年的主战场，在他看来，将走向“智能体互联网”时代——

基础大模型像操作系统一样在全球范围内收敛到不超过10个；而智能体会取代今天的大部分SaaS和App，成为企业和个人与世界交互的默认形态，同时这也是通往AGI的必经之路。

为了完整体现张亚勤的思考，在不改变原意的基础上，量子位对演讲内容进行了编辑整理，希望能给你带来更多启发。

MEET2026智能未来大会是由量子位主办的行业峰会，近30位产业代表与会讨论。线下参会观众近1500人，线上直播观众350万+，获得了主流媒体的广泛关注与报道。

核心观点梳理

新一轮人工智能是信息智能、物理智能和生物智能在统一token表征与规模定律驱动下的融合演进。

以ChatGPT与DeepSeek为代表，AI正从鉴别式走向生成式与推理式，在高效率、低成本和开源生态中加速落地。

生成式AI正快速演化为智能体，任务长度与能力同步提升、风险同步放大。

基础大模型相当于AI时代的操作系统，全球玩家不会超过十家，将重构为“基础模型+垂直/边缘模型+智能体网络”的新产业格局。

智能体互联网是未来5–10年最大方向，也是通往AGI的必经之路，预计在15–20年内完成从信息智能到物理智能、再到生物智能的跨越。

……

以下为张亚勤演讲全文：

从ChatGPT到DeepSeek：新一轮人工智能范式与“智能涌现”

今天我谈的是人工智能+的趋势，这个题目我也思考了有将近十年的时间，我出了一本书叫《智能涌现》，也总结了人工智能这十年的发展，这里面也包括我当时在10年前写的“智能+”和“人工智能+”的文章。

首先就是新一轮的人工智能，它是信息智能、物理智能和生物智能的融合，我们的信息世界、物理世界和生物世界都走向了数字化，所以它也是原子、分子和比特的融合。

张亚勤院士：基础大模型最终不超过10个，十年后机器人比人多 | MEET2026

人工智能已经有70年的历史了，过去的五年和十年发展尤其快，一个重要的里程碑就是2022年的ChatGPT，距离现在正好三年。

特别重要的就是ChatGPT所带来的从鉴别式的AI走向了生成式的AI，过去更多的是模式识别，现在我们可以创造新的内容，这里面有三个特别重要的概念：

首先它是一个统一的表征，即tokenization，不管是文字、语音，图片、视频，或者是蛋白质、DNA、细胞，或者是三维的激光雷达的点云信号，都可以把它变成一个统一的token。

token越多，数据越多，算力越强、算法越好，这个时候就越准确。

规模定律（Scaling Law）到了一定的规模的话，就会出现智能涌现，这也是我这本书的题目。另外一个重要时刻就是咱们中国的DeepSeek时刻，DeepSeek出来之后，首先就让整个模型从预训练走向推理。

张亚勤院士：基础大模型最终不超过10个，十年后机器人比人多 | MEET2026

另外一点当然很重要，它有很多的算法创新、架构创新、系统创新，可以说是高效率、高性能和低价格。

同时它又是个新的商业模式，它是开源的，用的MIT的license，这个本身是限制最少的开源架构，所以DeepSeek出来之后，在国内和全球范围内大幅度地加速了它的落地和应用，所以我把它叫做DeepSeek Moment，也是中国的一个路径。

AI发展的五大趋势

AI发展有五个趋势，首先就是生成式的AI正走向智能体的AI。

张亚勤院士：基础大模型最终不超过10个，十年后机器人比人多 | MEET2026

智能体是这两年AI方面一个新的发展，是最重要的一个创新。

过去七个月，Agent的任务长度就增长了两倍，准确度大于50%，其实也已经和人类对齐了。

第二个趋势很重要，就是规模定律在预训练阶段已经放缓了，尽管这个智能还在往前走，更多的智能放到后训练、推理、智能体阶段。

这里面很有意思的现象就是，推理的单位成本在过去一年下降了10倍，但是智能体本身的算力要求一年也是增长了10倍，所以一个乘10、一个除10正好平衡。

第三点就是，我们从信息智能走向物理智能和生物智能，大语言模型走向视觉语言动作模型（VLA，Vision-Language-Action）。

这里面有两个很重要的节点，一个是无人驾驶，无人驾驶今年就已经到达ChatGPT时刻，2030年就是DeepSeek时刻——即10%左右的新车拥有L4级无人驾驶的能力。

另外机器人一定是未来最大的赛道，尽管人形机器人还需要很多年，但是我认为在未来10年左右，我们机器人会比人的数目还要多。

一个不好的消息是，AI的风险正在快速上升，智能体出来之后我们的风险至少double（翻倍）。

未来5-10年最大发展方向：智能体互联网

如果看一下新产业格局的话，我们有基础大模型，像操作系统一样，上面有垂直模型，还有边缘模型。

基础大模型，全球可能最后不会超过10个，一半中国的，一半美国的，可能说不定还有一两个是别的国家的，中美两个国家有不同的路径，但是是引领全球。

这里面还包括开源和闭源，去年我记得我们还在争论到底以开源为主、还是闭源为主。现在我觉得比较清楚了——开源会成为更多的、更大的平台和生态，可能80%是开源， 20%的是闭源。

这个图就特别清楚，规模定律可以看到的Pre-train还在往上走，但是走的速率已经在平缓，Post-train在increase，智能体还是直线地往上走。

张亚勤院士：基础大模型最终不超过10个，十年后机器人比人多 | MEET2026

还有一点，智能体本身不仅仅是技术，它其实在形成网络，也形成新的经济形态。

所以我们以后如果看企业的架构都会有完全不同的一种概念，以后企业需要GPU、大模型、数据，然后包括我们的人力资源，有些可能是人，有些可能是智能体，所以这对于未来管理企业、开发产品都有很大的影响。

张亚勤院士：基础大模型最终不超过10个，十年后机器人比人多 | MEET2026

这张图是未来的技术架构，左边这张图是ChatGPT刚出来不久的时候我画的，如果看这个黄线的话，在左边可以看到基础大模型它是一个平台，上面有各种不同的领域垂直模型，而上面有SaaS（软件作为一种服务），在边缘会蒸馏出一个相对比较小的模型，再上面有APP，这是当时我想的架构。

张亚勤院士：基础大模型最终不超过10个，十年后机器人比人多 | MEET2026

10月我把这个架构做了更新，最重要的一点就是我认为未来我们的SaaS和在设备端或边缘端的手机APP都会被Agent取代，也就是说智能体是未来的SaaS和APP。

我举个例子，所谓的智能体，你可以有各种各样的，有消费者的、各个不同行业的、机器人的、无人驾驶的。

刘洋教授在清华做了一个医疗智能体，也是全球第一个智能体无人医院——想用智能体网络、多智能体去模拟真正的三甲医院，这里面当然有病人、医生、护士、各种不同的科室。

张亚勤院士：基础大模型最终不超过10个，十年后机器人比人多 | MEET2026

在这个虚拟世界里面，多智能体会互相交互和学习，然后持续快速地进化，这样就是能在很短的时间，比如说两天它就可以完成一个三甲医院两到三年的这些病例，而且准确度还要高得很多。

但我们并不是说让智能体来替代未来的医生，它更多的是作为助理，我们相信未来每个医生都会有TA的一个智能体。

所以如果看一下产业机遇的话，我把基础大模型看作是我们人工智能时代的一个操作系统，它会彻底重写、重构和重塑我们产业的形态。

就像在PC时代我们有Windows，在移动时代有安卓和iOS，同样在人工智能时代操作系统就是一个基础大模型。有了这个操作系统之后，它下面的芯片架构、上面的应用生态都会完全被重构。

张亚勤院士：基础大模型最终不超过10个，十年后机器人比人多 | MEET2026

也就是为什么现在芯片是以GPU为主的，上面的生态是以垂直模型加上边缘模型和智能体为主的，整个规模会比PC时代、移动时代大一个、两个甚至三个数量级。

另外，我们从互联网发展的角度来看的话，我们最早是PC互联，后来到了移动互联，再之后我们到了物联网，现在我们正走向Internet of Agents，也就是智能体互联网，我认为它是未来5到10年最大的发展方向。

张亚勤院士：基础大模型最终不超过10个，十年后机器人比人多 | MEET2026

智能体也是我们实现AGI通用人工智能的必经之路，这里面需要新的算法体系，比如说新的记忆体系、世界模型。

我认为未来五年的话，现在的自回归架构、Transformer、Diffusion可能就会被颠覆，有了这些东西之后我们就可以实现通用人工智能。

到底需要多长时间呢？

我认为可能需要15~20年。先是信息智能，再是物理智能，最后达到生物智能。

文章来自于“量子位”，作者 “编辑部”。

关键词: AI新闻 , AI线下活动 , 张亚勤 , 人工智能

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。
项目地址：https://github.com/Henry-23/VideoChat
在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址：https://github.com/PeterH0323/Streamer-Sales