张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026
6197点击    2025-12-12 08:55

从ChatGPT到DeepSeek,AI正沿着“智能+”的路径进入新一轮浪潮。


正值大模型从“算力堆叠”走向“推理优先”的关键节点,清华大学智能产业研究院(AIR)创始院长、中国工程院外籍院士张亚勤提出:


新一轮人工智能,是信息智能、物理智能和生物智能的融合,本质上也是原子、分子和比特的融合。


也就是说,在规模定律持续发挥作用的前提下,当参数规模、数据体量与算力资源跨过某个阈值,智能就不再只停留在模式识别,而是开始“涌现”——


先是从鉴别式AI走向生成式AI,再从生成式AI走向以智能体为代表的新范式。


在本次量子位MEET2026智能未来大会上,他也将ChatGPT和DeepSeek,视作这一轮演进中的两个重要里程碑:


前者通过统一表征与token化,把文本、语音、图像乃至蛋白质、点云等数据纳入同一空间;


后者则以高效率、高性能、低价格和开源路径,把大模型从“预训练时代”推向以推理为核心的“DeepSeek时刻”。


张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026


至于未来5~10年的主战场,在他看来,将走向“智能体互联网”时代——


基础大模型像操作系统一样在全球范围内收敛到不超过10个智能体会取代今天的大部分SaaS和App,成为企业和个人与世界交互的默认形态,同时这也是通往AGI的必经之路。


为了完整体现张亚勤的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。


MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众350万+,获得了主流媒体的广泛关注与报道。


核心观点梳理


  • 新一轮人工智能是信息智能、物理智能和生物智能在统一token表征与规模定律驱动下的融合演进。


  • 以ChatGPT与DeepSeek为代表,AI正从鉴别式走向生成式与推理式,在高效率、低成本和开源生态中加速落地。


  • 生成式AI正快速演化为智能体,任务长度与能力同步提升、风险同步放大


  • 基础大模型相当于AI时代的操作系统,全球玩家不会超过十家,将重构为“基础模型+垂直/边缘模型+智能体网络”的新产业格局。


  • 智能体互联网是未来5–10年最大方向,也是通往AGI的必经之路,预计在15–20年内完成从信息智能到物理智能、再到生物智能的跨越。


  • ……


以下为张亚勤演讲全文:


从ChatGPT到DeepSeek:新一轮人工智能范式与“智能涌现”


今天我谈的是人工智能+的趋势,这个题目我也思考了有将近十年的时间,我出了一本书叫《智能涌现》,也总结了人工智能这十年的发展,这里面也包括我当时在10年前写的“智能+”和“人工智能+”的文章。


首先就是新一轮的人工智能,它是信息智能、物理智能和生物智能的融合,我们的信息世界、物理世界和生物世界都走向了数字化,所以它也是原子、分子和比特的融合。


张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026


人工智能已经有70年的历史了,过去的五年和十年发展尤其快,一个重要的里程碑就是2022年的ChatGPT,距离现在正好三年。


特别重要的就是ChatGPT所带来的从鉴别式的AI走向了生成式的AI,过去更多的是模式识别,现在我们可以创造新的内容,这里面有三个特别重要的概念: 


首先它是一个统一的表征,即tokenization,不管是文字、语音,图片、视频,或者是蛋白质、DNA、细胞,或者是三维的激光雷达的点云信号,都可以把它变成一个统一的token。


token越多,数据越多,算力越强、算法越好,这个时候就越准确。


规模定律(Scaling Law)到了一定的规模的话,就会出现智能涌现,这也是我这本书的题目。 另外一个重要时刻就是咱们中国的DeepSeek时刻,DeepSeek出来之后,首先就让整个模型从预训练走向推理


张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026


另外一点当然很重要,它有很多的算法创新、架构创新、系统创新,可以说是高效率、高性能和低价格


同时它又是个新的商业模式,它是开源的,用的MIT的license,这个本身是限制最少的开源架构,所以DeepSeek出来之后,在国内和全球范围内大幅度地加速了它的落地和应用,所以我把它叫做DeepSeek Moment,也是中国的一个路径。


AI发展的五大趋势


AI发展有五个趋势,首先就是生成式的AI正走向智能体的AI


张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026


智能体是这两年AI方面一个新的发展,是最重要的一个创新。


过去七个月,Agent的任务长度就增长了两倍,准确度大于50%,其实也已经和人类对齐了。 


第二个趋势很重要,就是规模定律在预训练阶段已经放缓了,尽管这个智能还在往前走,更多的智能放到后训练、推理、智能体阶段。


这里面很有意思的现象就是,推理的单位成本在过去一年下降了10倍,但是智能体本身的算力要求一年也是增长了10倍,所以一个乘10、一个除10正好平衡。 


第三点就是,我们从信息智能走向物理智能和生物智能,大语言模型走向视觉语言动作模型(VLA,Vision-Language-Action)。


这里面有两个很重要的节点,一个是无人驾驶,无人驾驶今年就已经到达ChatGPT时刻,2030年就是DeepSeek时刻——即10%左右的新车拥有L4级无人驾驶的能力


另外机器人一定是未来最大的赛道,尽管人形机器人还需要很多年,但是我认为在未来10年左右,我们机器人会比人的数目还要多


一个不好的消息是,AI的风险正在快速上升,智能体出来之后我们的风险至少double(翻倍)


未来5-10年最大发展方向:智能体互联网


如果看一下新产业格局的话,我们有基础大模型,像操作系统一样,上面有垂直模型,还有边缘模型。


基础大模型,全球可能最后不会超过10个,一半中国的,一半美国的,可能说不定还有一两个是别的国家的,中美两个国家有不同的路径,但是是引领全球。


这里面还包括开源和闭源,去年我记得我们还在争论到底以开源为主、还是闭源为主。现在我觉得比较清楚了——开源会成为更多的、更大的平台和生态,可能80%是开源, 20%的是闭源


这个图就特别清楚,规模定律可以看到的Pre-train还在往上走,但是走的速率已经在平缓,Post-train在increase,智能体还是直线地往上走。


张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026


还有一点,智能体本身不仅仅是技术,它其实在形成网络,也形成新的经济形态


所以我们以后如果看企业的架构都会有完全不同的一种概念,以后企业需要GPU、大模型、数据,然后包括我们的人力资源,有些可能是人,有些可能是智能体,所以这对于未来管理企业、开发产品都有很大的影响。


张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026


这张图是未来的技术架构,左边这张图是ChatGPT刚出来不久的时候我画的,如果看这个黄线的话,在左边可以看到基础大模型它是一个平台,上面有各种不同的领域垂直模型,而上面有SaaS(软件作为一种服务),在边缘会蒸馏出一个相对比较小的模型,再上面有APP,这是当时我想的架构。


张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026


10月我把这个架构做了更新,最重要的一点就是我认为未来我们的SaaS和在设备端或边缘端的手机APP都会被Agent取代,也就是说智能体是未来的SaaS和APP


我举个例子,所谓的智能体,你可以有各种各样的,有消费者的、各个不同行业的、机器人的、无人驾驶的。


刘洋教授在清华做了一个医疗智能体,也是全球第一个智能体无人医院——想用智能体网络、多智能体去模拟真正的三甲医院,这里面当然有病人、医生、护士、各种不同的科室。


张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026


在这个虚拟世界里面,多智能体会互相交互和学习,然后持续快速地进化,这样就是能在很短的时间,比如说两天它就可以完成一个三甲医院两到三年的这些病例,而且准确度还要高得很多。


但我们并不是说让智能体来替代未来的医生,它更多的是作为助理,我们相信未来每个医生都会有TA的一个智能体。


所以如果看一下产业机遇的话,我把基础大模型看作是我们人工智能时代的一个操作系统,它会彻底重写、重构和重塑我们产业的形态。


就像在PC时代我们有Windows,在移动时代有安卓和iOS,同样在人工智能时代操作系统就是一个基础大模型。有了这个操作系统之后,它下面的芯片架构、上面的应用生态都会完全被重构。


张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026


也就是为什么现在芯片是以GPU为主的,上面的生态是以垂直模型加上边缘模型和智能体为主的,整个规模会比PC时代、移动时代大一个、两个甚至三个数量级。


另外,我们从互联网发展的角度来看的话,我们最早是PC互联,后来到了移动互联,再之后我们到了物联网,现在我们正走向Internet of Agents,也就是智能体互联网,我认为它是未来5到10年最大的发展方向


张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026


智能体也是我们实现AGI通用人工智能的必经之路,这里面需要新的算法体系,比如说新的记忆体系、世界模型。


我认为未来五年的话,现在的自回归架构、Transformer、Diffusion可能就会被颠覆,有了这些东西之后我们就可以实现通用人工智能。


到底需要多长时间呢?


我认为可能需要15~20年。先是信息智能,再是物理智能,最后达到生物智能


文章来自于“量子位”,作者 “编辑部”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales