谷歌DeepMindCEO:谷歌最接近AGI的模型是Veo,不是Gemini 3!没有引入广告的计划,曝AI眼镜最新进展:杀手级应用将出现

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
谷歌DeepMindCEO:谷歌最接近AGI的模型是Veo,不是Gemini 3!没有引入广告的计划,曝AI眼镜最新进展:杀手级应用将出现
6870点击    2026-01-27 16:16

谷歌DeepMindCEO:谷歌最接近AGI的模型是Veo,不是Gemini 3!没有引入广告的计划,曝AI眼镜最新进展:杀手级应用将出现


在达沃斯论坛之后,谷歌Deepmind CEO Demis Hassabis又连续上了两个播客,放出了不少谷歌的新动向!


出乎意料的是,相比于Gemini 3,Demis认为更接近AGI的系统是——视频生成模型Veo。原因是它更接近世界模型:通过生成10-20秒的真实视频,理解物理直觉、因果关系、物体如何在世界中运动。


谷歌DeepMindCEO:谷歌最接近AGI的模型是Veo,不是Gemini 3!没有引入广告的计划,曝AI眼镜最新进展:杀手级应用将出现


对于Anthorpic近期推出的Claude Cowrk,Demis不甘示弱地表示:谷歌对Gemini 3的编程能力也很满意。


不过,他也透露谷歌现在在代码方面投入很大,除了推出全新IDE平台Antigravity,他们也在重点提升Gemini的编程和工具调用能力。


针对ChatGPT传出增加广告功能的消息,Demis坚定地表示:Gemini目前没有引入广告的计划。


在《大科技播客》中,Demis还透露了谷歌AI眼镜的最新进展。谷歌已经与Warby Parker、Gentle Monster、三星等合作开发下一代眼镜,AI眼镜将于今年夏天推出。


谷歌和 Alphabet 在智能眼镜上有很深的历史积累,但Demis指出,过去的问题在于:设备太笨重、电池不够,最重要的是——没有“杀手级应用”。


他认为“杀手级应用”应该是一个通用的数字助理,能在手机、电脑、眼镜等各种界面上与用户进行交互,理解周围的环境。随着Gemini 3这一强大AI模型的推出,他认为谷歌已经很接近实现这一点。


他坦言,谷歌AI眼镜是他们正在进行的最令人兴奋的项目。


此外,Demis也肯定了世界模型是 AGI 的关键,因为它允许系统在现实世界中进行长期规划——这点与Yann LeCun的观点一致。


谷歌DeepMindCEO:谷歌最接近AGI的模型是Veo,不是Gemini 3!没有引入广告的计划,曝AI眼镜最新进展:杀手级应用将出现


不过LeCun之前在一期节目中表示:通用智能”这一概念本身纯属无稽之谈!还引来了Demis的反驳和辩论:Yann LeCun混淆了通用智能和“万物智能”。


谷歌DeepMindCEO:谷歌最接近AGI的模型是Veo,不是Gemini 3!没有引入广告的计划,曝AI眼镜最新进展:杀手级应用将出现


关于这场争论,Demis也在本期《金融时报》的播客中给出了正面回应。


Demis在这两次播客中也重申了一些他此前的观点,比如:


  • Scaling Law没有撞墙,谷歌内部能看到很明显的进步,现有范式还有很大上升空间;


  • 通往AGI还需要1-2个Transformer级别的重大突破,比如持续学习、更好的长期记忆机制、更高效的上下文窗口;


  • 距离实现AGI还有5-10年,不过这次Demis更新了一个说法:2030年可能有50%概率实现AGI;


  • 中国AI公司的进展目前相比美国头部公司只差6个月,但中国还没有做出Transformer级别的原创突破,并且Demis觉得西方对DeepSeek的反应有点被夸大了。


谷歌DeepMindCEO:谷歌最接近AGI的模型是Veo,不是Gemini 3!没有引入广告的计划,曝AI眼镜最新进展:杀手级应用将出现


以下是Demis在《大科技播客》和《金融时报》两期访谈内容的整理,有部分删减和润色,enjoy:


现有范式还有很大上升空间

Veo是最接近AGI的模型


Alex:


一年前,外界还在质疑 AI 的进展是否已经开始放缓。当时很流行的一种说法是:大语言模型是否已经撞墙了。但现在看来,这些问题似乎已经被现实回答了——过去一年里,AI 取得了巨大的进展。


你能否具体谈谈,是什么让整个行业从“是否撞墙”的质疑,走到了今天这个阶段?


Demis Hassabis:


坦率地说,我们内部从未真正怀疑过这一点。我们一直看到非常明显的进步,所以对外界当时的担忧其实有点困惑。


其中一个担忧来自“数据是否用完了”。确实,现有的人类数据被大量使用过了,人们会问:合成数据是否真的有用?但事实证明,我们依然可以从现有架构和数据中“榨出更多价值”。无论是在预训练、后训练、还是推理范式上,以及这些方法如何结合在一起,我们都看到了巨大的潜力。所以我认为,即便只使用我们已经掌握的技术,并在其基础上持续创新,仍然有非常大的上升空间。


Alex:


怀疑论者会说:你们其实是在大语言模型之上叠加了大量“技巧”,比如 scaffolding、orchestration、工具调用、搜索网页等。


但问题在于:模型在一个会话里学到的东西,一旦关闭就忘了。这是不是 LLM 范式本身的根本限制?


Demis Hassabis:


我确实认为,在通往 AGI 的路上,我们可能还需要一到两个真正重大的突破。比如持续学习、更好的长期记忆机制、更长或更高效的上下文窗口(不是把一切都存进去,而是只保留重要信息——这正是人脑的做法)、更强的长期推理与规划能力。


目前还不确定,仅靠现有技术不断 scale 是否足够,还是需要全新的、深刻的架构创新。如果一定要我选,我更偏向后者。


但无论如何,大型基础模型一定会是最终 AGI 系统的核心组成部分。我并不认同像 Yann LeCun 那样认为 LLM 是“死胡同”的观点。真正的分歧在于:它们是唯一组件,还是关键组件之一


DeepMind 的优势在于我们拥有非常深厚的研究积累,可以同时在两条路径上全速推进:一边继续扩展和改进现有范式(包括预训练层面的创新),一边探索全新的蓝天式架构想法——就像过去十多年我们发明 Transformer 那样。


Alex:


那如果一个系统里有大量“硬编码”的结构,它还能被称为 AGI 吗?


Demis Hassabis:


这取决于你所说的“多少”。


我对混合系统非常感兴趣,也有人称之为神经符号系统。AlphaGo、AlphaFold 就是很好的例子——它们结合了深度学习与蒙特卡洛搜索等明确的结构。


我们也在研究把大语言模型与进化算法结合起来,比如 AlphaEvolve,让系统能够主动发现新知识。


但无论采用什么架构,学习能力都是 AGI 的核心,甚至可以说是定义本身。“通用”指的就是通用学习能力——能否在任何领域学习新知识。


对我而言,学习几乎等同于智能。


Alex:


但如果学习等同于智能,而当前模型还无法持续学习,它们能搜索互联网、当下“理解”问题,但并不会真正改变模型本身。你们对如何解决持续学习问题,有什么方向性的想法吗?


Demis Hassabis:


我可以给你一些线索。我们确实在这方面投入了大量精力。


过去我们在 AlphaZero、AlphaGo Zero 中已经展示过:系统可以从零开始学习,或者在已有知识基础上继续学习——但这些都发生在非常狭窄、规则明确的领域(比如游戏)。


现实世界要复杂得多,这些方法是否能真正泛化仍有待验证。但至少我们已经知道:这些技术在受限环境下可以做到非常惊人的事情。


现在关键的问题是:能否将这些方法与大型基础模型融合起来


我们当然希望模型不仅在训练阶段学习,也能在“现实世界”中持续学习,包括个性化。一个真正优秀的助手,必须理解你、为你工作。


我们上周刚刚发布了第一代“个人智能”能力,但那还只是把数据放进上下文窗口里。真正理想的状态,是模型本身会随着时间发生变化——而这一点,目前还没有被真正攻克。


Alex:


说到 AGI,我之前和 Sam Altman 聊过。他说 AGI 的定义本身就很模糊,甚至希望大家能承认“我们已经越过 AGI,正在迈向超级智能”。


你同意这种说法吗?


Demis Hassabis:


我理解他为什么希望这么说,但我完全不同意。AGI 不应该变成一个营销概念。它一直有明确的科学定义:一个系统,能够展现出人类所具备的全部认知能力。


不仅是解题,而是提出突破性的理论;不仅是生成艺术,而是像毕加索、莫扎特那样创造全新的艺术范式;不仅是思维能力,还包括物理智能——对身体、运动、现实世界的控制。


今天的系统,在我看来离这一点还非常非常远。我认为真正的 AGI,至少还需要 5 到 10 年


Alex:


你最近提到,最接近 AGI 的系统并不是 Gemini 3,而是一个图像生成模型 “Nano Banana”。这让我非常惊讶。


Demis Hassabis:


名字确实有点玩笑性质。但更重要的是像我们的视频生成模型 Veo。从 AGI 的角度看,它更有意义。


一个能够生成 10–20 秒真实视频的模型,本质上是在学习世界模型——理解物理直觉、因果关系、物体如何在世界中运动。


世界模型是 AGI 的关键,因为它允许系统在现实世界中进行长期规划。这正是人类轻松做到、但当前 AI 仍然无法完成的事情。


这对机器人尤为重要:想象机器人在脑中模拟多种可能轨迹,再选择最优路径执行任务。


谷歌AI眼镜预计今年夏天推出

杀手级应用:通用数字助理


Alex:


我们聊点产品。我看了纪录片《The Thinking Game》,发现你一直拿着手机对着现实世界问 AI。


我当时就在想:你真的需要一副 AI 眼镜。手机显然不是正确的形态。你怎么看 AI 眼镜?什么时候会推出?


Demis Hassabis:


你说得完全对。我们内部“自用”这些系统时也非常明显:手机能用,但不是最佳形态。


很多场景,比如做饭、在城市中导航、辅助视障人群,都需要解放双手。对戴眼镜的人来说,把 AI 放在眼镜上是非常自然的下一步。


Google 和 Alphabet 在智能眼镜上有很深的历史积累。过去的问题在于:设备太笨重、电池不够,更重要的是——没有杀手级应用


现在我认为杀手级应用应该是一个通用数字助理,在手机、电脑、眼镜等任何界面都能用,理解你周围的每个环境。我认为我们已经很接近了,尤其是Gemini 3出来后,我们拥有了强大的AI能力,能让它成为现实。这是我们正在进行的最兴奋的项目之一,也是我个人正在努力的方向——让智能眼镜真正发挥作用。


我们已经和 Warby Parker、Gentle Monster、三星等合作开发下一代眼镜,如果进展顺利,你们可能在今年夏天就能看到它们


Gemini目前没有引入广告的计划


Alex:


我们来聊聊广告吧。现在这个时间点,真的适合在 AI 里引入广告吗?


最近有一些消息称,Gemini 未来可能会加入广告;你们的一些竞争对手也有类似传闻。我在社交媒体上看到一个挺好笑、但也挺尖锐的评论,有人说:“如果商业模式还是广告,那这些东西离 AGI 还远得很,也不可能成为真正颠覆世界的技术。”你同意这种说法吗?


Demis Hassabis:


这个问题很有意思,我认为这其实是一个“信号”。行动往往比言辞更有说服力。


如果有人一边说“AGI 已经近在眼前”,一边又在认真考虑往产品里塞广告,那确实会让人产生疑问:如果真的快到 AGI 了,你为什么还要折腾广告?这是一个合理的问题。


就我们目前而言,如果你问的是 Gemini 应用本身——我们现在没有任何引入广告的计划。当然,我们会非常谨慎地观察竞争对手(比如 ChatGPT)最终会怎么做。


但这里面存在一个非常重要的张力:如果你想打造的是一个真正“为你服务”的个人助理,那最核心的是什么?信任。包括信任、安全、隐私。你希望把自己的生活交给它,就必须确信:它是在代表你的利益行动,而不是其他人的利益。


所以广告这件事必须极其小心。理论上也许存在可行方案,但一旦广告逻辑“渗透”进推荐系统,就会让用户开始困惑:“它现在推荐这个,是为了我,还是为了广告主?”这是一个非常微妙、但极其关键的挑战。


Alex:


Sundar 在最近的财报电话会上提到,Google 内部确实在讨论“如何以正确方式处理这件事”。那你个人怎么看广告这件事?


Demis Hassabis:


我们还在头脑风暴阶段,没有定论。但我想补充一点:如果你把视角放到眼镜、可穿戴设备这些新形态上,其实是存在其他商业模式的,不一定非要走传统广告那条路。所以这是一个需要非常慎重思考的领域。


Alex


我还是想再确认一次,得到一个明确回答。我看到一些报道说:Google 去年曾对广告商表示,计划在 2026 年把广告引入 Gemini 聊天机器人。


Demis Hassabis


不。我们目前没有这样的计划。我只能说到这里。


谷歌正在全面提升

Gemini的编程和工具调用能力


Alex:


Anthropic 的 Claude Code、Claude Cowork 最近引发了巨大讨论。一位前亚马逊高管说,他用 Claude Code 一天半就搭了一个定制 CRM。


你怎么看?你们会推出类似的东西吗?


Demis Hassabis:


这真的非常令人兴奋。必须要说一句:Anthropic 做得非常好。


我们对 Gemini 3 的编程能力也非常满意,尤其是在前端方面。我自己在圣诞假期用它做了小游戏原型,效果非常惊人。说实话,它让我重新找回了写代码的乐趣。我非常喜欢现在正在发生的 “vibe coding” 浪潮。这会极大解放设计师、创意人、艺术家,过去他们必须依赖程序员团队,现在很多事情可以自己完成了。这将创造大量新的创作可能性。


我们在代码方向投入很大,刚刚发布了自己的 IDE —— Antigravity,需求非常旺盛,甚至有点供不应求。我们正在全力提升 Gemini 在编程和工具调用方面的能力。


但公平地说,Anthropic 的策略非常聚焦:他们不做图像模型、不做世界模型、不做多模态,只专注在 语言和代码,而且确实做得非常出色。


一方面我们很高兴能在某些层面与他们合作,另一方面,这也给了我们持续进步的动力。


Alex:


我们从更宏观的角度聊聊 AI 行业的商业前景。我有一个关于“AI 会如何崩塌”的理论,想听听你的看法。


它是一个三步过程:


  1. 大模型训练的边际收益开始下降
  2. 出现像 Gemini Flash 这样的超便宜模型,算力成本接近搜索
  3. 巨额算力与基础设施投入因此变得多余,引发连锁崩溃


这是一个合理的担忧吗?


Demis Hassabis:


这是一个可能发生的情景,但我不认为它是最有可能的。AI 已经证明了自己的价值,尤其是在科学领域——AlphaFold、药物发现等方向。我们已经远远越过了“AI 是否真的有用”的阶段。我确信AI 会成为人类历史上最具变革性的技术。


真正的不确定性只是时间尺度:是 2 年?还是 5 年?但无论如何,对如此重大的变革来说,都是“非常快”。


我认为现在反而存在一个巨大的能力滞后即便是今天的模型,能做的事情也远远超出我们真正部署和理解的范围。


对 Google 来说,我们才刚刚开始把 AI 深度嵌入到已有产品中,更不用说全新的 AI 原生产品。比如AI Inbox(谁愿意做邮件管理?)、浏览器代理、YouTube、搜索,机会是巨大的。


Alex:


所以你怎么看“AI 泡沫”这个说法?


Demis Hassabis:


我不觉得这是一个非黑即白的问题。我认为AI 行业的某些部分确实存在泡沫,另一些则没有。


比如,当你看到一些公司在没有产品、没有研究成果的情况下,就完成数十亿美元的融资,这在正常市场里显然是不可持续的。


但另一方面,我们这样的公司有着庞大的既有业务和产品体系,AI 如何提升效率和生产力是非常清晰的。


至于聊天机器人、眼镜等全新 AI 产品的市场规模,它们很可能非常巨大,但确实还需要时间验证。我的工作,是确保无论泡沫是否存在、是否破裂,DeepMind 和 Alphabet 都能赢。


在保守情形下,我们可以强化既有业务;在乐观情形下,我们站在最前沿。


信息是宇宙最基本的单位


Alex:


你最近说过,你认为信息,而不是能量或物质,是宇宙最基本的单位。能简单解释一下吗?


Demis Hassabis


很难用两分钟讲清,但我试试。如果你从生物学角度看:生命本质上是对抗熵增的信息系统。我们试图在混乱中维持结构与信息。


从更宏观的角度看:行星、山脉、小行星之所以能长期稳定存在,是因为它们的信息结构在某种“选择压力”下得以保留。


AlphaFold 正是一个很好的例子。蛋白质结构理论上有无限可能,但只有极少数是稳定的。理解这个“信息拓扑结构”,问题就不再是“大海捞针”。这正是 AI 将如何帮助我们发现新药、材料、超导体,本质上是在信息空间中导航


Alex:


在 AlphaGo 之后,你们让 AlphaZero 完全脱离人类知识,自主探索,结果它发现了人类从未想到的走法。


如果有一天,大模型也完全掌握了人类全部知识,然后被“放飞”,会发生什么?


Demis Hassabis:


我觉得那会非常令人兴奋。那一刻,才是真正的 AGI。它可能会发现室温超导体、全新的能源形式、更优的电池架构这些东西在物理规律中是可能的,只是我们还没找到。


一旦系统达到人类知识上限,再加上类似 AlphaZero 的机制,它就能进入真正的未知领域。


Alex:


就像把整个天气系统接入它的大脑。


Demis Hassabis:


对,正是这个意思。


中国AI公司进展相比美国只差6个月

美国对DeepSeek过度反应了


Roula:


你此前也谈到过 AI 竞赛,以及与中国之间的竞争。但从我的观察来看,中国似乎并不存在你们所说的那种“AI 竞赛”。那里并没有围绕 AGI 的竞速,而是更多聚焦在应用落地和效率提升上。


这种路线,会不会反而更现实一些?


Demis Hassabis:


这或许是一种风险更低的路径,但是否“更现实”,我不太确定。


不过我想补充一点:据我了解,中国市场内部的竞争同样非常激烈,并不比西方公司之间弱。只是你说得对,他们更关注短期内能做什么——眼下可以落地的应用,而不是那些更偏研究导向、指向 AGI 的前沿能力。


这本身没有问题。但我当初创办 DeepMind,如今在 Google DeepMind 和 Alphabet,我们的目标非常明确:构建 AGI。我们认为这是终极目标,一旦实现,将解锁我们多次讨论过的、极其广阔的世界级机遇。AGI 是我们的北极星。在通往它的过程中,我们当然也会创造大量有用的技术,但如果你想以尽可能具有创新性的方式推动研究,就必须有这样一个长期目标。这也是为什么在我看来,西方公司目前仍然领先


Roula:


那你认为领先优势有多大?是以“年”为单位,还是只是几个月?


Demis Hassabis:


我猜现在可能只差几个月。有意思的是,我和一些中国的领军企业家交流过,他们自己觉得落后得更多一些。我并不确定这是否准确。在我看来,也许是 6 个月左右的差距


我还想说一点:像 DeepSeek 这样的案例,在西方引发的反应,我认为有点被夸大了。中国的实验室确实在越来越快地追赶前沿但他们还没有证明自己能够超越前沿进行原创性突破——比如提出“下一个 Transformer”级别的架构创新。这一点,他们目前还没有展示出来。


与Yann LeCun的AGI分歧:

通用智能 vs “万物智能”


Roula:


最近几个月,关于 AGI 的讨论很多。你和 Yann LeCun 在这个问题上存在明显分歧,他认为“根本不存在通用智能”。你是研究大脑的专家,能否解释一下你为什么不同意他的观点?


Demis Hassabis:


是的,Yann 和我在会议上经常进行这种“友好的争论”,这次只是发生在网上。


坦率地说,我觉得他在这个问题上的论证有些站不住脚。他混淆了两个概念:通用智能和“万能智能”——即能理解一切可能存在之物。人类显然拥有前者。我们的文明本身就是最好的证明。


人类是制造工具的物种,这是我们与其他动物的根本区别。从飞机、计算机,到如今的 AI,本质上都是工具。AI 可以看作是计算工具的终极形态。


如果你把这些都纳入考虑——科学、工程、技术体系,人类智能显然是高度通用的。它并不是“能处理任何可能刺激视网膜的信号”,但这并不重要,它仍然是通用的。


我还会从 艾伦·图灵的角度来论证。图灵证明了:图灵机可以计算一切可计算的问题。这是一个极其通用的计算模型,而所有现代计算机都建立在这个基础之上。


大多数神经科学家也会同意:人脑在近似意义上是图灵完备的。这意味着,在理论上,我们可以理解几乎所有“可计算的事物”。


关键区别在于:是否具备学习能力,而不是是否已经掌握了全部知识。


单个人类当然是有限的,但从整体上看,人类大脑系统极其强大、灵活,而且高度通用。


Isomorphic Labs新进展:

与强生官宣药物项目新合作


Roula:


我们来聊聊 Isomorphic Labs。最初你们曾说计划在 2025 年第四季度进入临床试验,但后来变成了“临床前阶段”。发生了什么?


Demis Hassabis:


其实没有发生任何问题,是我当时口误了。几年前的一次采访中我说错了,正确的说法一直都是临床前阶段


我们去年已经进入了临床前试验,目前有多个药物项目在推进,进展非常顺利。一旦准备就绪,就会进入正式临床试验。


Roula:


那第一款由 AI 设计的药物,什么时候能真正问世?


Demis Hassabis:


我希望在未来几年内,但这取决于临床前和临床试验的进展。


Roula:


这件事比你原先预期的要困难吗?


Demis Hassabis:


完全没有。事实上,进展非常好


我们昨天刚刚宣布与强生(J&J) 达成新的合作。目前我们已经与 J&J、礼来(Eli Lilly)和诺华(Novartis) 合作,再加上我们自己的内部项目,总共有大约 17 个药物项目


今年上半年你们会听到我们公布更多进展。


Roula:


你们还宣布将在英国建立一个材料科学实验室,能多介绍一些吗?


Demis Hassabis


目前还处在比较早期阶段,但我认为:AI 在材料科学上的潜力巨大,包括半导体、超导体、电池等关键材料。


现在的阶段,大致相当于 AlphaFold 1 的水平——已经有非常有前景的研究原型,但还需要走得更远。


关键在于:我们需要能快速验证 AI 设计出的新材料。因此我们在考虑建立一种高度自动化的实验室,用来测试 AI 提出的理论化合物。


2030年有50%概率实现AGI


Roula:


我几乎每次见你都会问:AGI 的时间表是什么?最近我注意到,你们似乎都不太愿意再给出明确时间点了。Sam Altman 甚至说,我们几乎已经“到了那个阶段”。你现在的判断是什么?


Demis Hassabis


我的判断其实一直很一致5 到 10 年如果要更新一下,那可能是4 到 9 年,甚至 4 到 8 年。2030 年左右,可能是一个最早有 50% 概率的时间窗口。我仍然坚持这个判断。一些此前更激进的人,可能正在把时间线往后调,变得更现实一些。


经验告诉我:即便在如此快的进展速度下,事情往往还是比我们最初预期的要慢一些。但即便如此,这依然是非常、非常快的时间表。只是,它不会是明年。


参考链接:

https://www.youtube.com/watch?v=bgBfobN2A7A

https://www.youtube.com/watch?v=-RPbxvz6sB8


文章来自于“51CTO技术栈”,作者 “听雨”。

AITNT-国内领先的一站式人工智能新闻资讯网站